Progen är en så kallad transformer-baserad datamodell där en algoritm drar slutsatser efter att olika data matats in. I studien utgjordes data bland annat av information om vilken proteinfamilj en viss proteinsekvens tillhörde, vilken biologisk process den ingick i och vilken molekylär funktion proteinsekvensen hade.
AI baserad på språkalgoritm skapade nya fungerande proteiner
Inte ens proteiner går säkra för språkrobotarna. I det senaste numret av Nature Biotechnology presenterades språkmodellen Progen som, enligt forskarna bakom studien, lärt sig semantiken och grammatiken i proteinernas språk.