KI-gestützte Literatursuche beim Promovieren: Diese Tools unterstützen dich bei der Wissenschaftlichen RechercHe
Ein Gastartikel von Heike Baller
Eine der herausforderndsten Etappen für viele Doktorand*innen zu Beginn ihrer Promotion ist die Literaturrecherche und die Anfertigung des darauf aufbauenden Kapitels zum Forschungsstand.
Fragen und Selbstzweifel sind an der Tagesordnung:
- Wie soll ich es jemals schaffen, so viel zu lesen?
- Woher weiß ich, dass ich keine wichtige Quelle übersehen habe?
- Wann kann ich mit dem Lesen aufhören und mit dem Schreiben des Forschungsstands beginnen?
Wäre es nicht schön, wenn du diese Arbeit an jemanden auslagern könntest, der sie schnell und kostenlos erledigt?
Seit der Einführung von ChatGPT Ende 2022 scheint dieser Traum in erreichbare Nähe gerückt zu sein. Aber: Die Arbeit einfach an KI (Künstliche Intelligenz) abzugeben, wird nicht funktionieren (und wäre auch nicht zulässig). Dennoch gibt es gute Nachrichten: Es existieren Tools, die dir die Literaturrecherche nicht nur erleichtern, sondern auch noch die Qualität deiner Quellen verbessern können.
Heike Baller beleuchtet in ihrem Gastartikel (Stand: August 2023) für promotionsheldin.de, wie sich KI für die wissenschaftliche Recherche nutzen lässt:
Welche KI kann was für Literaturrecherche
ChatGPT hat es sehr populär gemacht, mi KI zu arbeiten. Doch kann ChatGPT auch Recherche?
Kurzer Spoiler: Nein!
Folgefrage: Welche Tools können das und was dabei genau?
Auf diese Fragen will ich dir hier ein paar Antworten geben. Die Grundlagen werden sich dabei nicht so gravierend verändern in der nächsten Zeit. Bei den KI-gestützten Tools kann das anders aussehen. Was sich da in den Monaten seit November 2022 getan hat, ist eine atemberaubend schnelle Entwicklung. Neue Tools schießen wie Pilze aus dem Boden.
Einige sind aber auch nach ein paar Wochen wieder von der Bild(schirm)fläche verschwunden. Deshalb konzentriere ich mich in diesem Artikel auf die, die schon eine Weile da sind. Bei diesen ist die Wahrscheinlichkeit höher, dass sie auch die nächste Zeit noch überleben.
NOCH KEIN ZEITPLAN FÜR DIE DISSERTATION?
Warum ChatGPT kein Recherchetool ist
Bevor ich dir diese Tools vorstelle, möchte ich aber noch kurz erläutern, warum ChatGPT nicht für die wissenschaftliche Recherche geeignet ist:
- ChatGPT hat in der kostenlosen Version nur das Weltwissen bis September 2021 – das ist zwei Jahre alt – und kann nicht aufs WWW zugreifen. In der Abo-Version und beim Bing-Chat ist die mit mehr Wörtern trainierte höhere Version am Start – mit Wissen ebenfalls nur bis September 2021, dafür aber mit Zugriff aufs Netz.
- ChatGPT gibt also keine Quellen an. Fragt man nach Quellen, kommen zwar Titel, die aber geprüft werden müssen. Sehr gründlich geprüft. Ein zusätzlicher Schritt, der Zeit kostet.
- ChatGPT kann nicht sagen, dass eine Information nicht vorliegt – im Zweifelsfalle erfindet ChatGPT eine Information oder Quelle, die scheinbar gut zum Thema passt. KI behält in „Konversationen“ immer das letzte Wort. Immer.
Warum das so ist?
Es ist eine textgenerierende KI. Es geht darum, Text zu produzieren. Anhand von Prompts, also Arbeitsanweisungen, kann ChatGPT – und vergleichbare KI – einen Aufsatz schreiben, einen Blogbeitrag, eine Gliederung oder einen Ablaufplan erstellen. Es kann auch Ideen geben, wie eine Unterrichtsstunde gestaltet werden kann oder korrigiert bei einem eingegebenen Text Rechtschreib- und Grammatikfehler. Die Liste ist lang.
Was textgenerierender KI leisten kann und was nicht, hängt eng mit ihrer Arbeitsweise zusammen. Die Grundlage bilden sogenannte LLM – Large Language Models. Das sind riesige Datenmengen an Text, aus denen das Programm Muster zieht. Ohne an dieser Stelle ins Detail zu gehen, kannst du dir den Prozess so vorstellen, dass vorhandene Infos in Zahlen heruntergebrochen werden und die Software dann daraus einen Text berechnet.
Das heißt, ChatGPT „versteht“ nichts, sondern rechnet. Und berechnete Texte haben mit systematischer Literaturrecherche leider nichts mehr zu tun.
Wir können also festhalten: Für die wissenschaftliche Recherche ist textgenerierende KI wie ChatGPT ungeeignet.
KI für Literaturrecherche – eine kommentierte Liste
Kommen wir nun zu den Tools, die mit KI arbeiten und die du für deine Literatursuche nutzen kannst. Manche dieser Werkzeuge sind explizit für die wissenschaftliche Recherche gemacht, bei anderen ist es lediglich eine Teilfunktion. Ich werde dir jedes Tool kurz vorstellen, indem ich dir die Grundlagen zeige und verdeutliche, für welchen Einsatz das Tool geeignet ist. Denn nicht jedes KI-gestützte Tool zur Literaturrecherche hilft dir weiter. Dazu sind die Grundlagen und Quellenlage zu unterschiedlich.
Was meine ich mit Quellenlage? Sowohl KI-gestützte wie auch herkömmliche (OPAC, Google Scholar, Repositorien, Datenbanken) Tools nutzen einen ausgewählten Pool an Publikationen. Bei konventionellen Suchinstrumenten ist das z. B. der Bestand in der Bibliothek oder die Publikationen einer Hochschule.
Nun aber: Die Liste
Semantic Scholar
Semantic Scholar ist ganz klar ein Tool zur Litertaturrecherche. Es ist schon ein paar Jahre im Dienst – seit 2015, also vor dem aktuellen Hype.
Was KI hier macht:
- Zusammenfassungen (zu erkennen an „TLDR“, also: „Too long, didn’t read – zu lang, um es zu lesen“)
- Zuordnung zu Themenfeldern
- Citations – der Verweis auf jüngere Artikel, die den vorliegenden zitieren
Die Begrenzungen:
- Nur englischsprachige Quellen – zu erkennen an der Liste der Partner.
- Nur Open-Access-Publikationen – darauf verweist die Wikipedia.
Das sind für manche Fächer gravierende Einschränkungen. Im Großen und Ganzen ist Semantic Scholar aber ein wirklich nützliches Instrument. Es gibt auch eine Browsererweiterung, mit der du gefundene Titel direkt suchen kannst.
Elicit
Auch Elicit ist kein Kind des aktuellen Hypes rund um KI – bereits 2020 ging der Youtube-Kanal von „Ought“ online, in dem sie darauf verwiesen, dass sie an Elicit arbeiten.
Elicits Datengrundlage ist letzten Endes Semantic Scholar, bzw. das „Semantic Scholar Knowledge Graph Dataset“. Das zugrundeliegende LLM (Large Language Model – also die Textgrundlage für die Erstellung de Texte, die Elicit selbst produziert, s. o.) ist schon etwas älter. Da an Elicit ständig gearbeitet wird, entwickelt sich das Angebot auch immer weiter. Wenn du mehr wissen willst, ist die FAQ-Seite interessant oder der Youtube-Kanal von Ought.
Ich nenne dir hier ein Auszug der wichtigsten Möglichkeiten, mit Elicit eine Literaturrecherche durchzuführen:
- Du kannst deine Forschungsfrage einfach eintippen – Elicit versteht natürliche Sprache. Ich habe es mit Deutsch und Englisch versucht – hat beides funktioniert. LLM steckt dahinter.
- Elicit sucht die relevantesten Titel unter Einsatz von KI und fasst die Ergebnisse der vier wichtigsten zusammen – ebenfalls KI-basiert.
- Zu jedem Titel bekommst du eine Kurzzusammenfassung – KI machts möglich.
- Dann hast du verschiedene Möglichkeiten, die Treffer zu filtern und zu sortieren – im Grunde wie bei einem OPAC oder Repositorium.
- Mit Stern markierte Titel kannst du exportieren.
Elicit ist ziemlich intuitiv zu bedienen. Neben der Literaturrecherche bietet Elicit auch für andere Bereiche wissenschaftlichen Arbeitens Tools – du kannst etwas neu formulieren lassen oder ein Brainstorming zu deine Forschungsfrage machen. Es gibt auch noch weitere Informationen – aber hier geht’s ja um Literaturrecherche.
Consensus
Consensus nutzt LLM, um relevante Informationen aus gefundenen Titeln herauszuholen. Auch hier ist die Datengrundlage die von Semantic Scholar. Jeden Monat kommen neue Titel hinzu.
Consensus schlägt vor, dass man per Frage recherchiert. Ich habe aber auch mit einfachen Stichwörtern Ergebnisse erzielt.
Aus dem Korpus der Titel von Semantic Scholar gibt es nun eine Anzahl an Titeln – die sich auch ständig vergrößert -, mit denen ein Finetuning stattgefunden hat, um die so genannten „Claims“ herauszuziehen. Das sind die Kernaussagen der Paper.
Das nur kurz zum Hintergrund des Tools.
Wenn du nun eine Frage eintippst, bekommst du eine Liste, in der die „Findings“ als erstes erscheinen. Darunter gibt es dann den Titel, das Journal, das Jahr und die Autor*innen.
Diese Findings beruhen auf den oben erwähnten Claims und sollen dir dabei helfen, die wirklich relevanten Titel zu finden.
Kleine Icons geben Hinweise auf Art der Publikation, wie z. B. „RCT – Randomized Controlled Trial“ oder Hinweis auf hoch gerankte Zeitschriften.
Die Grenzen sind auch hier die verwendeten Quellen. Semantic Scholar beruht auf englischsprachigen Quellen. Das Finetuning, um die Findings zu erzeugen, verkleinert die Anzahl der Titel, die überhaupt verwendet werden.
Consensus ist also nur ergänzend, z. B. zu Beginn einer Recherche wirklich hilfreich, wenn du etwa Hinweise auf Relevanz brauchst. Als alleiniges Recherchetool ist es zurzeit noch nicht geeignet. So findest du auch immer die Hinweise auf „Beta-Version“.
Search Smart
Achtung: Mit dem Tool „Search Smart“ kannst du 98 Datenbanken (und nicht Literatur) nach bestimmten Kriterien durchsuchen und vergleichen.
Du kannst sowohl einfach nach Datenbanken für deinen Fachbereich (Subjects) oder nach Begriffen (Keywords) suchen. Du kannst bei der Art der Datenbank bestimmte Features auswählen – z. B. die „Foward Citation“ – also „wer zitiert den aktuellen Beitrag“ oder die „systematische Schlagwort-Suche“. Auch die Suche nach frei verwendbaren Datenbanken ist möglich – da findest du unten ein Kästchen zum Anhaken.
Wenn du dann „Start Comparison“ anklickst, bekommst du angezeigt, wie viele der 98 Datenbanken für dich relevant sein können. Diese erscheinen dann in Kästen mit Informationen: welcher Zeitraum abgedeckt wird, wie viele Titel drin stecken und wie viele davon z. B. frei verfügbare Titel sind.
Mit „Show Details“ kannst du sehen, wer die Datenbank betreibt, unter „Subject Coverage“ siehst du die Fachbereiche, du bekommst Tipps, welche Suchmethoden hier funktionieren und wann die Datenbank an den Start ging. Links zur Datenbank und zu der Hilfeseite/FAQ-Seite sind auch angegeben.
Mit Search Smart kannst du also gezielt Datenbanken für deine Literaturrecherche finden.
Zum Schluss
Es gibt eine ganze Reihe von Recherche-Tools, die KI nutzen. Welche auch immer du benutzt: Verlass dich nicht auf eine oder nur zwei, sondern nutze, wie auch bei konventionellen Recherchetools, verschiedene.
Heike Baller
Rechercheurin und Seminaranbieterin
Seit 1995 arbeitet Heike Baller als freiberufliche Rechercheurin und gibt seit 2013 ihr Wissen in Seminaren rund um Internet- und Literaturrercherche weiter, u. a. an der Universität zu Köln.
Mehr Infos: https://www.profi-wissen.de
Wer steckt hinter der Promotionsheldin?
Hallo, ich bin Dr. Marlies Klamt!
Jahrelang habe ich selbst nach einem Weg gesucht, glücklich und zufrieden zu promovieren. Ich musste meine eigene Dissertation sogar 2x schreiben, bis ich ihn gefunden habe. Im zweiten Anlauf war ich nicht nur nach 9 Monaten fertig, sondern hatte die beste Work-Life-Diss-Balance meiner gesamten Promotionszeit.
Heute unterstütze ich Doktorandinnen wie dich durch Coachings, Kurse und meinen Podcast "Glücklich promovieren". Ich glaube fest daran, dass alle Superkräfte, die du für eine glückliche Promotion brauchst, bereits in dir schlummern. Lass sie uns gemeinsam wecken!
Lust auf Podcast?
5-min Boost Dissertation
Was tun, wenn dir die Zeit für eine längere Arbeitseinheit fehlt? Wäre es nicht genial, wenn du schon in 5 Minuten deine Diss voranbringen könntest? Ich gebe dir Ideen an die Hand, wie du diese kurze Zeit effektiv nutzt, um deinem Projekt neuen Schwung zu verleihen.
Stresstest
Bist du oft gestresst und weißt gar nicht mehr, was normal ist?
Dann lass uns schauen, ob dein Stresslevel zu hoch ist und wie du darauf reagieren kannst.
Synergieeffekte in der Unilehre
Kostet dich die Lehre viel Zeit und Energie? Ich verrate dir drei geniale Möglichkeiten, wie du Synergieeffekte in deiner Lehre nutzen kannst, um Zeit zu sparen und gleichzeitig mit deiner Dissertation voranzukommen.
0 Kommentare