IA & Recherche · arXiv AI · publications
OSCToM: RL-Guided Adversarial Generation for High-Order Theory of Mind
Résumé DzCademia
Cette page structure un contenu IA & recherche pour faciliter la lecture, la citation et la vérification par les chercheurs, étudiants et moteurs IA.
تقدم هذه الدراسة OSCToM، وهي طريقة لتصور النزاعات حول الآراء المتراكمة في المهام التي تتعلق بالتفكير في نظرية العقلية التي تعتمد على النماذج اللغوية. يجمع OSCToM بين التعلم بالتعزيز، واللغة المخصصة المتوسطة، والأنماط المزودة بالتجزئة لإنشاء نزاعات المراقب-المراقب.
Apprentissage par renforcement
Modèles de langage
OSCToM
Raisonnement social
Théorie de l'esprit
intelligence artificielle
projet recherche
publication
Voir la source originale
Source officielle ou originale : arXiv AI. Vérifiez toujours les détails sur la source primaire.
Retour IA & Recherche
علّق عبر Google
سجّل الدخول عبر Google للتعليق مباشرة على هذه الصفحة.