Forscher des Biotechnologischen Zentrums (BIOTEC) der Technischen Universität Dresden haben ein Large Language Model (LLM) namens Grover entwickelt, das menschlichen genetischen Code wie eine Sprache behandelt.
Grover wurde mit einem menschlichen Referenzgenom trainiert.
Grover lernt die „Grammatik“ der DNA und teilweise die Abfolge von DNA-Sequenzen vorhersagen.
Nur ein bis zwei Prozent des Genoms bestehen aus Genen, die für Proteine codieren.
Grover versucht auch, die noch unverstandenen Teile der DNA besser zu verstehen.