Mi az az önfelügyelt tanulás?

Az önfelügyelt tanulás (angolul: Self-supervised Learning) egy mesterséges intelligencia tanulási módszer, amelyben a modell saját magának generál címkéket vagy felügyeleti jeleket a tanuláshoz, külső kézi címkézés nélkül. Ez a megközelítés hidat képez a felügyelt és a felügyelet nélküli tanulás között.

A modell megtanulja felismerni az adatok belső struktúráját úgy, hogy előrejelzési vagy kitöltési feladatokat végez rajtuk. Ez különösen hasznos akkor, amikor nagy mennyiségű címkézetlen adat áll rendelkezésre, de a manuális címkézés költséges vagy időigényes lenne.

Hogyan működik?

  1. Pretext-feladatok: a modell mesterséges tanulási feladatokat kap (pl. egy mondat hiányzó szavának kitalálása)
  2. Jellemzők tanulása: a modell a feladatok megoldása során megtanulja az adatok belső szerkezetét
  3. Finomhangolás: a betanított modellt később felügyelt módon tovább lehet képezni specifikus feladatokra

Példa:

Hol használják?

Előnyök és kihívások

Előnyök:

Kihívások:

Összefoglalva

Az önfelügyelt tanulás lehetővé teszi, hogy AI-modellek kevesebb kézi beavatkozással tanuljanak meg komplex adatstruktúrákat. Ez az egyik kulcstechnológia a modern generatív modellek és LLM-ek mögött.