TED2025.4.18---Shahram Izadi:未來智慧眼鏡



Fordító: Reka Lorinczy Lektor: Peter Pallos 0:04 Egész életünkben számítástechnikai forradalomban élünk. 0:08 A jelenlévők közül sokan átélték 0:11 a számítástechnika ugrásszerű fejlődését, 0:13 a kapcsolatteremtést, a mobil technológiákat, 0:16 és most az MI-t is. 0:18 Egész pályafutásomat a kiterjesztett valóságnak szenteltem, 0:23 ötvözve a valós világot a számítástechnikai élményekkel. 0:26 Körülbelül 25 éve kezdtem a PhD-vel. 0:31 Lehet, hogy úttörőnek hangzik, de nézzék ezeket a korai prototípusokat! 0:35 A technológia akkoriban szörnyen primitív volt, 0:38 de határtalan lehetőség volt benne, 0:40 amikor az egyetemi laborban kísérleteztünk. 0:44 Amit akkoriban nem tudtam, 0:45 hogy munkámban alkalmazott alapvető újítások 0:49 másik labor MI-kutatóitól származnak. 0:54 Miközben segítettem a számítógépeknek látni a világot, 0:56 ezek az MI-kutatók segítettek a számítógépeknek megérteni a világot. 1:01 Azóta a nagy nyelvi modellek és a multimodális érvelés 1:05 gazdagabb nyelvi és képi megértést tettek lehetővé. 1:10 E modellek most elég gyorsak az élő beszélgetésekhez, 1:14 ahol az MI felléphet helyettünk, 1:16 és ami a legfontosabb, az engedélyünkkel. 1:20 A kibővített valóság és a virtuális valóság a téglalap alakú képernyőről 1:25 átkerült a 360 fokos látótérbe, 1:29 és most már maga a világ válik a képernyőnkké. 1:33 E széles körű tapasztalatgyűjteményt 1:36 kiterjesztett valóságnak vagy XR-nek nevezzük. 1:39 Eddig 1:41 ezek az újítások külön és egységekben történtek. 1:46 Itt jön a számítástechnikai forradalom második felvonása. 1:50 Az MI és az XR konvergálnak, radikális új módszereket nyitnak meg 1:53 a technológiával való interakcióhoz a feltételeink szerint. 1:58 A számítógépek könnyebbé és személyesebbé válnak. 2:02 Ismertetik a nézőpontunkat, 2:04 megértik a valós kontextusokat, 2:06 és természetes felületük egyszerű és beszédes. 2:12 Vállalatok és személyek fejlesztenek ezen a téren, 2:17 köztük sokan a héten a TED színpadán szerepelnek. 2:20 Örülünk, hogy hozzájárulhatunk mi is az Android XR segítségével. 2:25 Ezt az operációs rendszert a Samsunggal fejlesztjük. 2:28 Ez az XR hardvert a Geminivel, az MI asszisztensünkkel kombinálja 2:33 az emberi intelligencia növelésére. 2:36 Eszközök széles skáláját támogatja, 2:39 a fejhallgatóktól a szemüvegig, 2:41 hogy olyat hozzanak létre melyről még csak nem is álmodtunk. 2:44 Hadd mutassam meg, merre tartunk! 2:47 Kérem Nishtha kollégámat a színpadra! 2:51 Üdvözöllek, Nishtha! 2:52 (Taps) 2:54 Nishtha Bhatia: Szia! 2:55 Shahram Izadi: E szokásos szemüveg tele van technológiával. 2:59 A minikamerával és mikrofonokkal 3:02 az MI látja és hallja a világot. 3:05 A hangszórókból az MI szól: 3:08 zenét hallgathatunk vagy hívást fogadhatunk. 3:10 A szemüvegnek apró, 3:13 nagy felbontású belső képernyője van, 3:16 teljes színfelbontással. 3:17 Itt tartom a kezemben. 3:19 Nagyon, nagyon kicsi. 3:22 A szemüveg telefonunkkal összhangban működik, 3:26 oda-vissza streamel, így nagyon könnyű, 3:28 és hozzáfér az összes telefonalkalmazáshoz. 3:30 Bevallom, rajtam is ilyen szemüveg van. 3:33 Mindenkit látok a nézőtéren, 3:36 mert fókuszálható lencsék vannak benne. 3:38 De megjeleníti beszédemhez írt jegyzeteimet is. 3:41 (Nevetés) 3:43 A bemutatóban látni fogják, 3:44 mit lát Nishtha a mögötte lévő képernyőn. 3:47 Ez az első alkalom, hogy nyilvánosan bemutatjuk ezt a szemüveget. 3:51 Élő bemutató lesz a koncepcionális hardverről és a korai szoftverről. 3:56 Mi történhet rosszul? 3:58 Nishtha, sok szerencsét. 4:00 Nincs nyomás. 4:01 NB: Elképesztő. 4:03 Rendben, győződjünk meg, hogy a szemüveg 4:05 megjelenik a mögöttünk lévő képernyőn. 4:08 Oké. 4:09 [A szemüveg képernyője kikapcsolva] 4:13 Fantasztikus. 4:14 (Taps) 4:16 Most elindítom a Geminit. 4:19 Gemini: Helló! 4:21 NB: Szia, Gemini! 4:22 Kezdjünk valami szórakoztató és kreatív dologgal, 4:25 írnál egy rövid verset ahhoz, amit most látok? 4:30 G: Persze. 4:31 Ragyogó arcok. 4:32 Lelkes elmék várják a szavakat. 4:34 A gondolat szikrái kipattannak. 4:36 SI: Néhány szorongó, de boldog arc is van, igen. 4:40 Mint láthatjuk, az MI is látja, amit Nishtha lát, 4:42 hallja, amit hall, 4:44 és valós időben reagál. 4:46 Ez nem magas tét. 4:47 Azt hiszem, mindenki látott már ilyen demókat. 4:51 Nehezítsük valamivel, amit Memóriának nevezünk. 4:54 A gördülő kontextuális ablak esetében 4:56 az MI emlékszik arra, amit lát, 4:58 anélkül, hogy meg kellene mondjuk, mit kell nyomon követnie. 5:02 NB: Lehet, hogy észrevettétek, 5:04 hogy egy pillanattal ezelőtt rápillantottam a polcra. 5:07 Nem figyeltem, de lássuk, hogy a Gemini észrevette-e. 5:12 Hé, véletlenül elkaptad 5:14 a polcon mögöttem lévő fehér könyvnek a címét? 5:20 G: A fehér könyv James Clear Atomic Habits című könyve. 5:24 NB: Pontosan. 5:26 Próbáljunk meg valami nehezebbet! 5:28 Folyton elveszítem a szállodai kulcskártyámat. 5:31 Tudod, hol hagytam utoljára? 5:35 G: A szállodai kulcskártyád a zene CD jobb oldalán található. 5:39 NB: Nagyszerű. 5:41 SI: Az olyan feledékeny embernek, mint én, ez létfontosságú alkalmazás. 5:45 Jó, ez az MI eredendően multimodális. 5:47 Vizuális adatokat és természetes nyelvet használ összetett lekérdezések 5:51 valós időben történő feldolgozására, 5:53 miközben emlékszik a múltbeli kontextusra. 5:56 Nishtha, lássunk még valamit. 5:57 NB: Igen, hozzuk vissza ezt a könyvet. 6:00 Most nincs időm elolvasni. 6:03 De kíváncsi vagyok, hogy a Gemini össze tudja foglalni röviden a történetet? 6:08 Mintha nem ismerném. 6:10 Mit jelent ez a diagram? 6:12 Bonyolultnak tűnik. 6:14 G: A diagram felirata: Habit Line, 6:17 és szokások kialakulásának folyamatát szemlélteti. 6:20 Megmutatja, hogy az ismétlésekkel az automatizmus hogyan növekszik, 6:23 amíg szokássá nem válik. 6:25 NB: Rendben. 6:26 SI: Képzeljék el, hogy bármilyen nyelven kommunikál és ért! 6:30 Az MI a kimenetét úgy változtatja meg, hogy több nyelven beszéljen, 6:34 olyan dialektusban és akcentussal, amelyik emberinek és természetesnek tűnik. 6:38 NB: Igen, menjünk erre a táblára. 6:41 Lefordítanád ezt angolra nekem? 6:45 G: Azt írja: „Magántulajdon, tilos az átjárás” 6:49 SI: Rendben, bizonyítsuk be, hogy ez élő demo. 6:51 A közönségből van valakinek javaslata, 6:53 hogy milyen nyelvre fordítsuk le? 6:55 Közönség: Perzsa. 6:56 SI: Perzsa. 6:58 Kipróbáltuk a perzsát, legutóbb nem sikerült, de próbáljuk újra. 7:01 NB: Szeretnéd kipróbálni a perzsát? 7:03 SI: Beszélek perzsául. 7:04 Ez az anyanyelvem, szóval köszönöm. 7:07 NB: Gemini, próbáljuk meg! 7:09 Le tudnád fordítani ezt a jelet perzsa nyelvre? 7:14 G: (Perzsául beszél) 7:17 SI: Nagyszerű, fantasztikus. 7:19 Perzsául beszél. 7:21 NB: Ez csodálatos. 7:22 Tehát, ahogy Shahram említette, 7:24 mindannyian láttak már ilyen fordítói demókat, 7:28 de most az az újdonság, 7:30 hogy amellett, hogy beszél nyelveket, 7:33 én is beszélhetek a Geminivel más nyelven. 7:36 Tudok hindiül, szóval próbáljuk ki! 7:41 (Hindiül beszél) 7:49 G: (Hindiül beszél) 7:51 NB: A Gemini azt mondta, hogy mindannyian koncentráltnak és izgatottnak tűntök, 7:56 és jobb a kiejtése, mint nekem. 7:57 (Nevetés) 7:59 SI: Rendben, most nézzük meg, hogyan kapcsolja össze az MI 8:03 a fizikai világot a digitális tartalommal, és mit tesz. 8:06 NB: Igen, adjunk egy kis zenét! 8:09 Oké, Gemini, játszol nekünk egy számot erről a lemezről? 8:16 GB: Persze, íme Teddy Swims: Bad Dreams. 8:20 (Zene) 8:23 SI: Tökéletes. 8:24 Néhány másodperc alatt az MI felismerte az albumot, 8:27 megkereste a listát, 8:28 és a telefonalkalmazások segítségével lejátszotta. 8:30 Nishtha, úgy néz ki, mintha a demoistenek velünk lennének. 8:33 Talán inkább veled vannak, mint velem. 8:35 Csináljunk még egy utolsó demót, 8:37 égsz a vágytól, hogy bemutasd! 8:39 NB: Igen, először vagyok Vancouverben, 8:41 és szeretek sétálni. 8:43 Kérlek, vigyél el olyan közeli parkba, ahonnan kilátás nyílik az óceánra. 8:51 G: Rendben, induljunk a Lighthouse Parkba, 8:54 ahonnan csodálatos kilátás nyílik a Csendes-óceánra. 8:58 Van még valami, amiben segíthetek? 9:00 NB: Hát ezzel az útbaigazítással és egy 3D-s térképpel készen állok, 9:04 és remélem, nem látszom turistának. 9:07 Köszönöm mindenkinek. 9:08 (Taps) 9:15 SI: Köszönöm, Nishtha, ez fantasztikus volt. 9:17 Láttunk már szemüveget. 9:19 Most fordítsuk figyelmünket a spektrum másik felére: a fejhallgatóra! 9:23 Láttunk már ilyen típusú eszközöket, 9:25 de amikor először kapcsoltuk az MI-t fejhallgatóhoz, 9:28 az egészen meglepett. 9:31 E bemutatóhoz a Project Moohan fejhallgatót használjuk, 9:33 amelyet a Samsung ez év végén dob piacra. 9:36 A szemüveghez képest a fejhallgató végtelen kapcsolatot nyújt 9:40 munkához, filmnézéshez 9:43 vagy esetleg TED-beszélgetés hallgatásához. 9:45 Max kollégámat kérem, mutasson még valamit nekünk. 9:48 Szia, Max. 9:49 Max Spear: Helló. 9:50 (Taps) 9:51 SI: Itt is ugyanez fog történni. 9:54 Pontosan azt látjuk, amit Max a képernyője hátterében. 9:58 Menj rá, Max. 9:59 MS: Mutassuk meg! 10:01 Észre fogjuk venni, hogy a valós világban kezdünk. 10:03 Szememmel, kezemmel és hangommal fogom irányítani az egész rendszert. 10:08 De a dolgok érdekesebbé válnak, 10:10 amikor a Geminit beszélgetni hívjuk, 10:14 aki bárhová velünk jöhet. 10:17 G: Helló. 10:19 MS: Szia, Gemini, megmutatod az utazástervezőmet? 10:23 G: Természetesen. Megnyitom az utazástervezőt. 10:25 MS: Nagyszerű, de ezeket az ablakokat nagyon rendezetlenül hagytam. 10:29 Tudnál segíteni ebben? 10:31 G: Természetesen segítek. 10:34 SI: Nincs kattintás, nincs billentyűzet. 10:36 Ez csak beszélgetés. 10:38 Az MI pedig végrehajtja. 10:41 Vonjuk be jobban a közönséget! 10:43 Valaki kiabálja egy hely nevét, amelyet szeretnénk meglátogatni. 10:46 Közönség: Melbourne. 10:48 Közönség: Fokváros. 10:49 SI: Menjünk Fokvárosba! 10:50 Max: Szórakoztatónak hangzik. 10:52 El tudnál vinni Fokvárosba? 10:57 G: Természetesen. 10:58 Hadd segítsek az ablakok rendezésében. 11:00 SI: (Nevet) 11:01 MS: Fantasztikus. 11:02 El tudnál vinni Fokvárosba is? 11:04 (Nevetés) 11:06 G: Biztosan meg tudom csinálni. 11:07 Hadd vigyelek Fokvárosba. 11:09 MS: Nagyon szervezettek vagyunk, miközben odamegyünk, tökéletes. 11:12 SI: Amint láthatják, az MI elfogadja Max kéréseit, 11:15 kitalálja, hogyan lehet a legjobban válaszolni rájuk, 11:17 és megnyitja a Maps alkalmazást. 11:19 Innentől kezdve valóban felfedezheti a világ bármely pontját 3D-s nézetben. 11:24 MS: Elég hihetetlen ebből a szögből nézni a világot, 11:27 még nagyíthatom a városi szintekre is. 11:29 De ami igazán érdekes, hogy itt van az MI, 11:32 aki látja, amit látok. 11:33 Tudnád ismertetni a hely látványosságait? 11:39 G: Mesélhetek az Asztalhegyről. 11:43 Az Asztalhegy nevezetes 11:45 természetes pompájáról 11:47 és gazdag kulturális történetéről. 11:49 Régóta szellemi és kulturális szimbóluma 11:52 az őslakos koikoi és a szan népnek. 11:54 MS: Nagyon jó, Gemini. 11:56 Később visszatérünk rá. 11:57 Úgy néz ki, mint egy asztal, ez praktikus. 12:00 SI: Max, nézzünk valami ismertebbet! 12:02 Mi lenne, ha felfedeznénk a téli sportokat, 12:04 hiszen Vancouverben vagyunk. 12:06 MS: Rendben, mutassunk valami lelkesítőt Shahramnak. 12:08 Körbemutatod nekünk ezt a helyet? 12:11 [Porzó hódeszkázás] 12:14 G: Persze, itt van néhány 360 fokos porzó hódeszkázó videó. 12:18 MS: Kezdő hódeszkázó vagyok, 12:21 remélhetőleg ez a videó segít tanulni. 12:23 Bár ez már sokkal nehezebbnek tűnik, 12:25 mint amire készen állok. 12:28 Mi volt a neve ennek a trükknek? 12:32 G: Ez egy hátsó 540-es fogóval. 12:36 SI: Az MI pontosan tudja, mit néz Max, 12:38 még gazdag videotartalmakban is, 12:40 és valós időben válaszol bármilyen kérdésre. 12:43 Max, biztos vagy benne, hogy ez Whistler? 12:46 MS: Shahram, fogalmam sincs róla. 12:48 Még sosem voltam itt, de derítsük ki. 12:52 Mit gondolsz, melyik pálya ez? 12:57 G: Valószínűleg az egyik gondozatlan pálya a csúcsnál, 13:00 vagy a West Ridge felső szakaszában a Bachelor-hegyen, 13:02 mivel közel vannak a csúcshoz, 13:04 és észak felé néz a Three Sisters és a Broken Top felé, 13:07 a háttérben láthatók kiemelkedő hegycsúcsok. 13:09 MS: Mount Bachelor, Oregon, megértettem. 13:11 SI: Rendben, szórakozzunk kicsit. 13:14 Hadd mesélje el az MI ezt a videót. 13:16 Valaki a közönségből adjon meg szórakoztató elbeszélési stílust, 13:19 például természeti dokumentumfilmest vagy ilyesmit. 13:22 Közönség: Morgan Freeman. 13:24 SI: Nem tudunk színészeket utánozni, de valamikor eljutunk oda is. 13:28 Más javaslatok? 13:30 Közönség: Film előzetes. 13:31 Közönség: Horror film. 13:33 SI: Horrorfilm. 13:34 Ez lesz... lehet, hogy szörnyű, de próbáljuk ki. 13:37 MS: Kissé sötét, de legyen ez. 13:40 Leírnád, hogy mit látsz 13:42 úgy, mintha túlságosan lelkes karakter lennél egy horrorfilmben? 13:49 G: Ó, drágám, ez egyszerűen csodálatos. 13:51 Elhagyatott hegyi táj. 13:52 Milyen kellemesen baljós. 13:54 Készülj fel hátborzongató táncra az ismeretlennel, 13:57 ahol minden széllökés jeges rémület és rejtőző árnyékok meséit suttogja. 14:01 MS: Gemini, ez nagyszerű. 14:03 Máskor pozitívabb dolgokkal folytatjuk. 14:06 SI: Max, tudom, hogy van egy utolsó demód, 14:08 és nyilván gyakoroltad a gazdálkodási készségedet? 14:12 MS: Igen, Shahram, izgatottan vártam, 14:14 hogy visszatérjek vidéki gyökereimhez, 14:17 és tehetem a kedvencem: játszhatok. 14:19 De teljesen új, következő szintű élménnyé válik 14:22 az MI társaságában, 14:23 aki mellettünk van játék közben. 14:25 és segít megtanulni, hogyan kell játszani az ilyen típusú játékokat. 14:29 Pl. mit kéne tennem itt ezután? 14:36 G: Úgy tűnik, hogy a Stardew Valley játék elején vagy. 14:39 Pénzt kell keresned, ezért próbálj meg néhány magot ültetni. 14:42 Először kapáld meg a talajt, majd ültess el magokat. 14:45 Úgy tűnik, van egy kis paszternák. 14:47 Mivel nem esik az eső, 14:48 kannából meg is kell öntözöd őket. 14:52 MS: Soknak tűnik, és talán egykor robotok megteszik ezt helyettünk, 14:55 de egyelőre később még be kell nézzek a farmomra. 14:58 Végül is, össze tudod foglalni játékos két mondatba, 15:01 mivel foglalkoztunk ma? 15:07 G: A digitális birodalom megszervezésétől indultunk, 15:09 átvágtunk a havas hegyeken, 15:11 sőt, időt szakítottunk virtuális paszternák termesztésre is. 15:14 Elég kalandos volt. 15:16 MS: Igazán jó kaland. 15:17 Kösz, Gemini. 15:18 (Taps) 15:24 SI: Fantasztikus, köszönöm Max. 15:26 Belépünk a számítástechnikai forradalom izgalmas új szakaszába. 15:30 A fejhallgató és a szemüveg csak a kezdet. 15:33 Mindez a jövő egyetlen jövőképére mutat, olyan világra, 15:36 ahol a hasznos MI konvergál a könnyű XR-rel. 15:41 Az XR eszközök hordozhatóbbá válnak, 15:44 azonnali hozzáférést biztosítva az információkhoz. 15:47 Míg az MI kontextuálisan tudatosabbá válik, beszélgetős, 15:51 személyre szabott lesz, 15:53 és a mi feltételeinek szerint nyelvünkön dolgozik velünk. 15:57 Már nem bővítjük a valóságunkat, 15:59 hanem inkább intelligenciánkat bővítjük. 16:02 Köszönöm szépen. 16:04 (Taps)

No comments: