Elképesztő ütemben és sokféleségben láthatjuk az arfelismeréses technológiák térhódítást (lásd jelen írás végén, kapcsolódó cikkeinket). A legújabb hír a témában, hogy a közelmúltban megjelent tanulmányukban a MIT Számítástechnika és Mesterséges Intelligencia Laboratóriumának kutatói egy olyan módszert mutattak be , amely viszonylagos pontossággal képes hangminta alapján is egy személy arcát.
Bátorkodunk feltételezni , hogy az alábbi módszer tömeges alkalmazása – nem kevés, egyebek között adatvédelmi és egyéb kérdőjel mellett – azért nem a közeljövő kihívása lesz. A szerk.
A Speech2Face
A “Speech2Face: A Hang Mögött Lévő Arc Megismerése” projekt feltételezi az arcstruktúra bizonyos elemei és a hang közötti korrelációkat. A kutatók egy olyan neurális hálózati architektúrát fejlesztettek, amely kifejezetten az audio rekonstrukció feladatának elvégzésére készült, a módszerhez a Youtube-ból és más internetforrásokból gyűjtött személyek természetes videóit használták. A kutatók arcok és a beszédek szinkronizálását veszik alapul a videókban, hogy megtanulják a személy arcának rekonstrukcióját a beszédszegmensekből.