{"id":33107,"date":"2024-05-14T13:00:00","date_gmt":"2024-05-14T11:00:00","guid":{"rendered":"https:\/\/www.l3s.de\/?p=33107"},"modified":"2024-07-26T13:25:06","modified_gmt":"2024-07-26T11:25:06","slug":"does-a-language-model-understand-high-school-math-a-survey-of-deep-learning-based-word-problem-solvers","status":"publish","type":"post","link":"https:\/\/www.l3s.de\/de\/does-a-language-model-understand-high-school-math-a-survey-of-deep-learning-based-word-problem-solvers\/","title":{"rendered":"\"Verstehen\" Sprachmodelle Oberstufen-Mathe?"},"content":{"rendered":"<p><strong>Best L3S Publication of the Quarter (Q1\/2024\u00a0)<\/strong><br><strong>Category: NLP, LLM<\/strong><\/p>\n\n\n\n<p style=\"font-size:23px\"><strong>\"Verstehen\" Sprachmodelle Oberstufen-Mathe? <br>A survey of deep learning based word problem solvers\u202f<\/strong><\/p>\n\n\n\n<p>Authors: Sowmya S Sundaram, Sairam Gurajada, Deepak Padmanabhan, Savitha Sam Abraham, Marco Fisichella: \u00a0<\/p>\n\n\n\n<p><em>Published in the Q1 journal \u201cWiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery\u201d<br><\/em><a href=\"https:\/\/wires.onlinelibrary.wiley.com\/doi\/pdfdirect\/10.1002\/widm.1534\">https:\/\/wires.onlinelibrary.wiley.com\/doi\/pdfdirect\/10.1002\/widm.1534<\/a><\/p>\n\n\n\n<div style=\"height:28px\" aria-hidden=\"true\" class=\"wp-block-spacer\"><\/div>\n\n\n\n<p><strong>Die Ver\u00f6ffentlichung in K\u00fcrze:<\/strong>&nbsp;<\/p>\n\n\n\n<p>Unsere Arbeit befasst sich mit der Entwicklung und Bewertung von Algorithmen, die automatisch mathematische Textaufgaben l\u00f6sen, eine Aufgabe, die Textmustererkennung mit mathematischem Denken verbindet. Trotz umfangreicher Forschung bleibt es eine Herausforderung, robuste Darstellungen f\u00fcr grundlegende mathematische Textaufgaben zu finden. W\u00e4hrend das L\u00f6sen einfacher arithmetischer Textaufgaben als gel\u00f6stes Problem gilt, zeigen wir, wie viele Nuancen noch zu ber\u00fccksichtigen sind. Im Laufe der Jahre haben sich verschiedene Modelle entwickelt, von handgefertigten regelbasierten Systemen bis hin zu Deep-Learning-Modellen, die Sequenz-zu-Sequenz-Paradigmen, graphenbasierte Modelle und gro\u00dfe Sprachmodelle (LLMs) umfassen.<s> <\/s>learning models that include sequence-to-sequence paradigms, graph-based models, and large language models (LLMs).&nbsp;<\/p>\n\n\n\n<p><strong>Welches Problem l\u00f6sen Sie mit Ihrer Forschung?&nbsp;<\/strong><\/p>\n\n\n\n<p>Wir \u00fcberpr\u00fcfen Deep-<s> <\/s>Learning-Ans\u00e4tze f\u00fcr Textaufgaben, analysieren ihre St\u00e4rken und Schw\u00e4chen und stellen fest, dass sie zwar vielversprechende Ergebnisse zeigen, aber noch L\u00fccken aufweisen, die es zu schlie\u00dfen gilt, wie z. B. Stabilit\u00e4t, Korrektheit und Vertrauen. Dazu geh\u00f6rt auch eine kritische Untersuchung der Versuchspl\u00e4ne und der in der Forschung \u00fcblicherweise verwendeten Datens\u00e4tze.&nbsp;<\/p>\n\n\n\n<p>Auch die historischen und aktuellen Fortschritte auf diesem Gebiet werden angesprochen, wobei auf die zahlreichen Versuche hingewiesen wird, MWPs mit verschiedenen Computertechniken zu l\u00f6sen. Wir schlagen k\u00fcnftige Forschungsrichtungen vor, darunter die Verbesserung der Modellrobustheit, die Schaffung repr\u00e4sentativerer Datens\u00e4tze und die Verfeinerung von Bewertungsma\u00dfst\u00e4ben, um das Verst\u00e4ndnis der Modelle f\u00fcr mathematische Konzepte besser beurteilen zu k\u00f6nnen.&nbsp;<\/p>","protected":false},"excerpt":{"rendered":"<p>The best L3S publication of the quarter in the NLP\/LLM category addresses the question whether large language models &#8220;understand&#8221; high school maths. <\/p>","protected":false},"author":11,"featured_media":34198,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[161],"tags":[],"class_list":["post-33107","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-best-publications"],"acf":[],"aioseo_notices":[],"publishpress_future_workflow_manual_trigger":{"enabledWorkflows":[]},"_links":{"self":[{"href":"https:\/\/www.l3s.de\/de\/wp-json\/wp\/v2\/posts\/33107","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.l3s.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.l3s.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.l3s.de\/de\/wp-json\/wp\/v2\/users\/11"}],"replies":[{"embeddable":true,"href":"https:\/\/www.l3s.de\/de\/wp-json\/wp\/v2\/comments?post=33107"}],"version-history":[{"count":18,"href":"https:\/\/www.l3s.de\/de\/wp-json\/wp\/v2\/posts\/33107\/revisions"}],"predecessor-version":[{"id":34200,"href":"https:\/\/www.l3s.de\/de\/wp-json\/wp\/v2\/posts\/33107\/revisions\/34200"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.l3s.de\/de\/wp-json\/wp\/v2\/media\/34198"}],"wp:attachment":[{"href":"https:\/\/www.l3s.de\/de\/wp-json\/wp\/v2\/media?parent=33107"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.l3s.de\/de\/wp-json\/wp\/v2\/categories?post=33107"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.l3s.de\/de\/wp-json\/wp\/v2\/tags?post=33107"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}