Neue Entscheidung erhöht Verantwortlichkeiten der Plattformen für Entfernung von Inhalten
17/03/2025KI beim Schummeln erwischt : Wie LLMs ihre eigenen Tests überlisten
17/03/2025Bahnbrechende KI-Forschung taucht auf
Wissenschaftler haben einen bemerkenswerten Meilenstein in der künstlichen Intelligenz erreicht : ein KI-System, das vollständige wissenschaftliche Arbeiten ohne menschliches Eingreifen verfasst. Das bahnbrechende System, AI Scientist-v2, hat nicht nur ein akademisches Papier über die Generalisierung neuronaler Netzwerke generiert, sondern auch ein strenges Peer-Review bei einem ICLR-Workshop bestanden – was das erste Mal markiert, dass eine von KI verfasste Arbeit diese wissenschaftliche Hürde genommen hat. Durch Kooperationen zwischen Sakana AI und renommierten Universitäten wie Oxford und der University of British Columbia demonstriert das System einen bedeutenden Schritt in Richtung Maschinen, die unabhängig wissenschaftliche Forschung durchführen und kommunizieren können. Die Arbeit mit dem Titel “Compositional Regularization” berichtete ein negatives Ergebnis bei der Entwicklung neuer Regularisierungsmethoden, während sie dennoch wettbewerbsfähige Bewertungen gegenüber menschlichen Einreichungen erzielte.
Bahnbrechende Forschungsergebnisse
Ein Forschungsteam hat einen bedeutenden Meilenstein erreicht, da ihr KI-System erfolgreich eine von Fachkollegen begutachtete wissenschaftliche Arbeit verfasst und veröffentlicht hat. Die innovative Studie “Compositional Regularization : Unexpected Obstacles in Enhancing Neural Network Generalization” markiert den ersten Fall einer vollständig maschinell generierten Arbeit, die bei einer angesehenen Konferenz angenommen wurde.
Das System entwickelte selbstständig Hypothesen, entwarf Experimente und analysierte Ergebnisse ohne menschliches Eingreifen. In Zusammenarbeit mit Forschern der University of British Columbia und der Oxford University erstellte die KI drei Arbeiten, wobei eine für den ICLR 2025 Workshop-Track angenommen wurde. Das Team nutzte Google Trends-Daten, um sicherzustellen, dass ihre Forschung mit aktuellen wissenschaftlichen Interessen und aufkommenden Themen im Fachgebiet übereinstimmt.
Die angenommene Arbeit erzielte eine beeindruckende durchschnittliche Gutachterbewertung von 6,33, übertraf damit die Akzeptanzschwelle der Konferenz und schnitt besser ab als mehrere von Menschen eingereichte Beiträge. Während die Errungenschaft bemerkenswerten Fortschritt demonstriert, identifizierten Gutachter Verbesserungsbereiche, darunter Zitiergenauigkeit und experimentelle Reproduzierbarkeit.
Dieser Fortschritt stellt einen wesentlichen Schritt zur Förderung der Automatisierung wissenschaftlicher Forschung dar. Trotz derzeitiger Einschränkungen bei der Beurteilung von Neuartigkeit und der Durchführung von Experimenten deutet der Erfolg des Systems auf vielversprechendes Potenzial zur Unterstützung zukünftiger wissenschaftlicher Entdeckungen hin. Die gemeinschaftliche Anstrengung hielt während des gesamten Einreichungsprozesses strenge ethische Richtlinien und Transparenz ein.
Die nächste Phase des Forschungsteams konzentriert sich darauf, die Fähigkeiten des Systems zu verbessern, um die Qualität erstklassiger menschlicher Forschung zu erreichen, während sorgfältige menschliche Aufsicht beibehalten wird, um wissenschaftliche Integrität und ethische Einhaltung zu gewährleisten.