TED2025.4.18---Shahram Izadi:未來智慧眼鏡
Fordító: Reka Lorinczy Lektor: Peter Pallos
0:04
Egész életünkben számítástechnikai forradalomban élünk.
0:08
A jelenlévők közül sokan átélték
0:11
a számítástechnika ugrásszerű fejlődését,
0:13
a kapcsolatteremtést, a mobil technológiákat,
0:16
és most az MI-t is.
0:18
Egész pályafutásomat a kiterjesztett valóságnak szenteltem,
0:23
ötvözve a valós világot a számítástechnikai élményekkel.
0:26
Körülbelül 25 éve kezdtem a PhD-vel.
0:31
Lehet, hogy úttörőnek hangzik, de nézzék ezeket a korai prototípusokat!
0:35
A technológia akkoriban szörnyen primitív volt,
0:38
de határtalan lehetőség volt benne,
0:40
amikor az egyetemi laborban kísérleteztünk.
0:44
Amit akkoriban nem tudtam,
0:45
hogy munkámban alkalmazott alapvető újítások
0:49
másik labor MI-kutatóitól származnak.
0:54
Miközben segítettem a számítógépeknek látni a világot,
0:56
ezek az MI-kutatók segítettek a számítógépeknek megérteni a világot.
1:01
Azóta a nagy nyelvi modellek és a multimodális érvelés
1:05
gazdagabb nyelvi és képi megértést tettek lehetővé.
1:10
E modellek most elég gyorsak az élő beszélgetésekhez,
1:14
ahol az MI felléphet helyettünk,
1:16
és ami a legfontosabb, az engedélyünkkel.
1:20
A kibővített valóság és a virtuális valóság a téglalap alakú képernyőről
1:25
átkerült a 360 fokos látótérbe,
1:29
és most már maga a világ válik a képernyőnkké.
1:33
E széles körű tapasztalatgyűjteményt
1:36
kiterjesztett valóságnak vagy XR-nek nevezzük.
1:39
Eddig
1:41
ezek az újítások külön és egységekben történtek.
1:46
Itt jön a számítástechnikai forradalom második felvonása.
1:50
Az MI és az XR konvergálnak, radikális új módszereket nyitnak meg
1:53
a technológiával való interakcióhoz a feltételeink szerint.
1:58
A számítógépek könnyebbé és személyesebbé válnak.
2:02
Ismertetik a nézőpontunkat,
2:04
megértik a valós kontextusokat,
2:06
és természetes felületük egyszerű és beszédes.
2:12
Vállalatok és személyek fejlesztenek ezen a téren,
2:17
köztük sokan a héten a TED színpadán szerepelnek.
2:20
Örülünk, hogy hozzájárulhatunk mi is az Android XR segítségével.
2:25
Ezt az operációs rendszert a Samsunggal fejlesztjük.
2:28
Ez az XR hardvert a Geminivel, az MI asszisztensünkkel kombinálja
2:33
az emberi intelligencia növelésére.
2:36
Eszközök széles skáláját támogatja,
2:39
a fejhallgatóktól a szemüvegig,
2:41
hogy olyat hozzanak létre melyről még csak nem is álmodtunk.
2:44
Hadd mutassam meg, merre tartunk!
2:47
Kérem Nishtha kollégámat a színpadra!
2:51
Üdvözöllek, Nishtha!
2:52
(Taps)
2:54
Nishtha Bhatia: Szia!
2:55
Shahram Izadi: E szokásos szemüveg tele van technológiával.
2:59
A minikamerával és mikrofonokkal
3:02
az MI látja és hallja a világot.
3:05
A hangszórókból az MI szól:
3:08
zenét hallgathatunk vagy hívást fogadhatunk.
3:10
A szemüvegnek apró,
3:13
nagy felbontású belső képernyője van,
3:16
teljes színfelbontással.
3:17
Itt tartom a kezemben.
3:19
Nagyon, nagyon kicsi.
3:22
A szemüveg telefonunkkal összhangban működik,
3:26
oda-vissza streamel, így nagyon könnyű,
3:28
és hozzáfér az összes telefonalkalmazáshoz.
3:30
Bevallom, rajtam is ilyen szemüveg van.
3:33
Mindenkit látok a nézőtéren,
3:36
mert fókuszálható lencsék vannak benne.
3:38
De megjeleníti beszédemhez írt jegyzeteimet is.
3:41
(Nevetés)
3:43
A bemutatóban látni fogják,
3:44
mit lát Nishtha a mögötte lévő képernyőn.
3:47
Ez az első alkalom, hogy nyilvánosan bemutatjuk ezt a szemüveget.
3:51
Élő bemutató lesz a koncepcionális hardverről és a korai szoftverről.
3:56
Mi történhet rosszul?
3:58
Nishtha, sok szerencsét.
4:00
Nincs nyomás.
4:01
NB: Elképesztő.
4:03
Rendben, győződjünk meg, hogy a szemüveg
4:05
megjelenik a mögöttünk lévő képernyőn.
4:08
Oké.
4:09
[A szemüveg képernyője kikapcsolva]
4:13
Fantasztikus.
4:14
(Taps)
4:16
Most elindítom a Geminit.
4:19
Gemini: Helló!
4:21
NB: Szia, Gemini!
4:22
Kezdjünk valami szórakoztató és kreatív dologgal,
4:25
írnál egy rövid verset ahhoz, amit most látok?
4:30
G: Persze.
4:31
Ragyogó arcok.
4:32
Lelkes elmék várják a szavakat.
4:34
A gondolat szikrái kipattannak.
4:36
SI: Néhány szorongó, de boldog arc is van, igen.
4:40
Mint láthatjuk, az MI is látja, amit Nishtha lát,
4:42
hallja, amit hall,
4:44
és valós időben reagál.
4:46
Ez nem magas tét.
4:47
Azt hiszem, mindenki látott már ilyen demókat.
4:51
Nehezítsük valamivel, amit Memóriának nevezünk.
4:54
A gördülő kontextuális ablak esetében
4:56
az MI emlékszik arra, amit lát,
4:58
anélkül, hogy meg kellene mondjuk, mit kell nyomon követnie.
5:02
NB: Lehet, hogy észrevettétek,
5:04
hogy egy pillanattal ezelőtt rápillantottam a polcra.
5:07
Nem figyeltem, de lássuk, hogy a Gemini észrevette-e.
5:12
Hé, véletlenül elkaptad
5:14
a polcon mögöttem lévő fehér könyvnek a címét?
5:20
G: A fehér könyv James Clear Atomic Habits című könyve.
5:24
NB: Pontosan.
5:26
Próbáljunk meg valami nehezebbet!
5:28
Folyton elveszítem a szállodai kulcskártyámat.
5:31
Tudod, hol hagytam utoljára?
5:35
G: A szállodai kulcskártyád a zene CD jobb oldalán található.
5:39
NB: Nagyszerű.
5:41
SI: Az olyan feledékeny embernek, mint én, ez létfontosságú alkalmazás.
5:45
Jó, ez az MI eredendően multimodális.
5:47
Vizuális adatokat és természetes nyelvet használ összetett lekérdezések
5:51
valós időben történő feldolgozására,
5:53
miközben emlékszik a múltbeli kontextusra.
5:56
Nishtha, lássunk még valamit.
5:57
NB: Igen, hozzuk vissza ezt a könyvet.
6:00
Most nincs időm elolvasni.
6:03
De kíváncsi vagyok, hogy a Gemini össze tudja foglalni röviden a történetet?
6:08
Mintha nem ismerném.
6:10
Mit jelent ez a diagram?
6:12
Bonyolultnak tűnik.
6:14
G: A diagram felirata: Habit Line,
6:17
és szokások kialakulásának folyamatát szemlélteti.
6:20
Megmutatja, hogy az ismétlésekkel az automatizmus hogyan növekszik,
6:23
amíg szokássá nem válik.
6:25
NB: Rendben.
6:26
SI: Képzeljék el, hogy bármilyen nyelven kommunikál és ért!
6:30
Az MI a kimenetét úgy változtatja meg, hogy több nyelven beszéljen,
6:34
olyan dialektusban és akcentussal, amelyik emberinek és természetesnek tűnik.
6:38
NB: Igen, menjünk erre a táblára.
6:41
Lefordítanád ezt angolra nekem?
6:45
G: Azt írja: „Magántulajdon, tilos az átjárás”
6:49
SI: Rendben, bizonyítsuk be, hogy ez élő demo.
6:51
A közönségből van valakinek javaslata,
6:53
hogy milyen nyelvre fordítsuk le?
6:55
Közönség: Perzsa.
6:56
SI: Perzsa.
6:58
Kipróbáltuk a perzsát, legutóbb nem sikerült, de próbáljuk újra.
7:01
NB: Szeretnéd kipróbálni a perzsát?
7:03
SI: Beszélek perzsául.
7:04
Ez az anyanyelvem, szóval köszönöm.
7:07
NB: Gemini, próbáljuk meg!
7:09
Le tudnád fordítani ezt a jelet perzsa nyelvre?
7:14
G: (Perzsául beszél)
7:17
SI: Nagyszerű, fantasztikus.
7:19
Perzsául beszél.
7:21
NB: Ez csodálatos.
7:22
Tehát, ahogy Shahram említette,
7:24
mindannyian láttak már ilyen fordítói demókat,
7:28
de most az az újdonság,
7:30
hogy amellett, hogy beszél nyelveket,
7:33
én is beszélhetek a Geminivel más nyelven.
7:36
Tudok hindiül, szóval próbáljuk ki!
7:41
(Hindiül beszél)
7:49
G: (Hindiül beszél)
7:51
NB: A Gemini azt mondta, hogy mindannyian koncentráltnak és izgatottnak tűntök,
7:56
és jobb a kiejtése, mint nekem.
7:57
(Nevetés)
7:59
SI: Rendben, most nézzük meg, hogyan kapcsolja össze az MI
8:03
a fizikai világot a digitális tartalommal, és mit tesz.
8:06
NB: Igen, adjunk egy kis zenét!
8:09
Oké, Gemini, játszol nekünk egy számot erről a lemezről?
8:16
GB: Persze, íme Teddy Swims: Bad Dreams.
8:20
(Zene)
8:23
SI: Tökéletes.
8:24
Néhány másodperc alatt az MI felismerte az albumot,
8:27
megkereste a listát,
8:28
és a telefonalkalmazások segítségével lejátszotta.
8:30
Nishtha, úgy néz ki, mintha a demoistenek velünk lennének.
8:33
Talán inkább veled vannak, mint velem.
8:35
Csináljunk még egy utolsó demót,
8:37
égsz a vágytól, hogy bemutasd!
8:39
NB: Igen, először vagyok Vancouverben,
8:41
és szeretek sétálni.
8:43
Kérlek, vigyél el olyan közeli parkba, ahonnan kilátás nyílik az óceánra.
8:51
G: Rendben, induljunk a Lighthouse Parkba,
8:54
ahonnan csodálatos kilátás nyílik a Csendes-óceánra.
8:58
Van még valami, amiben segíthetek?
9:00
NB: Hát ezzel az útbaigazítással és egy 3D-s térképpel készen állok,
9:04
és remélem, nem látszom turistának.
9:07
Köszönöm mindenkinek.
9:08
(Taps)
9:15
SI: Köszönöm, Nishtha, ez fantasztikus volt.
9:17
Láttunk már szemüveget.
9:19
Most fordítsuk figyelmünket a spektrum másik felére: a fejhallgatóra!
9:23
Láttunk már ilyen típusú eszközöket,
9:25
de amikor először kapcsoltuk az MI-t fejhallgatóhoz,
9:28
az egészen meglepett.
9:31
E bemutatóhoz a Project Moohan fejhallgatót használjuk,
9:33
amelyet a Samsung ez év végén dob piacra.
9:36
A szemüveghez képest a fejhallgató végtelen kapcsolatot nyújt
9:40
munkához, filmnézéshez
9:43
vagy esetleg TED-beszélgetés hallgatásához.
9:45
Max kollégámat kérem, mutasson még valamit nekünk.
9:48
Szia, Max.
9:49
Max Spear: Helló.
9:50
(Taps)
9:51
SI: Itt is ugyanez fog történni.
9:54
Pontosan azt látjuk, amit Max a képernyője hátterében.
9:58
Menj rá, Max.
9:59
MS: Mutassuk meg!
10:01
Észre fogjuk venni, hogy a valós világban kezdünk.
10:03
Szememmel, kezemmel és hangommal fogom irányítani az egész rendszert.
10:08
De a dolgok érdekesebbé válnak,
10:10
amikor a Geminit beszélgetni hívjuk,
10:14
aki bárhová velünk jöhet.
10:17
G: Helló.
10:19
MS: Szia, Gemini, megmutatod az utazástervezőmet?
10:23
G: Természetesen. Megnyitom az utazástervezőt.
10:25
MS: Nagyszerű, de ezeket az ablakokat nagyon rendezetlenül hagytam.
10:29
Tudnál segíteni ebben?
10:31
G: Természetesen segítek.
10:34
SI: Nincs kattintás, nincs billentyűzet.
10:36
Ez csak beszélgetés.
10:38
Az MI pedig végrehajtja.
10:41
Vonjuk be jobban a közönséget!
10:43
Valaki kiabálja egy hely nevét, amelyet szeretnénk meglátogatni.
10:46
Közönség: Melbourne.
10:48
Közönség: Fokváros.
10:49
SI: Menjünk Fokvárosba!
10:50
Max: Szórakoztatónak hangzik.
10:52
El tudnál vinni Fokvárosba?
10:57
G: Természetesen.
10:58
Hadd segítsek az ablakok rendezésében.
11:00
SI: (Nevet)
11:01
MS: Fantasztikus.
11:02
El tudnál vinni Fokvárosba is?
11:04
(Nevetés)
11:06
G: Biztosan meg tudom csinálni.
11:07
Hadd vigyelek Fokvárosba.
11:09
MS: Nagyon szervezettek vagyunk, miközben odamegyünk, tökéletes.
11:12
SI: Amint láthatják, az MI elfogadja Max kéréseit,
11:15
kitalálja, hogyan lehet a legjobban válaszolni rájuk,
11:17
és megnyitja a Maps alkalmazást.
11:19
Innentől kezdve valóban felfedezheti a világ bármely pontját 3D-s nézetben.
11:24
MS: Elég hihetetlen ebből a szögből nézni a világot,
11:27
még nagyíthatom a városi szintekre is.
11:29
De ami igazán érdekes, hogy itt van az MI,
11:32
aki látja, amit látok.
11:33
Tudnád ismertetni a hely látványosságait?
11:39
G: Mesélhetek az Asztalhegyről.
11:43
Az Asztalhegy nevezetes
11:45
természetes pompájáról
11:47
és gazdag kulturális történetéről.
11:49
Régóta szellemi és kulturális szimbóluma
11:52
az őslakos koikoi és a szan népnek.
11:54
MS: Nagyon jó, Gemini.
11:56
Később visszatérünk rá.
11:57
Úgy néz ki, mint egy asztal, ez praktikus.
12:00
SI: Max, nézzünk valami ismertebbet!
12:02
Mi lenne, ha felfedeznénk a téli sportokat,
12:04
hiszen Vancouverben vagyunk.
12:06
MS: Rendben, mutassunk valami lelkesítőt Shahramnak.
12:08
Körbemutatod nekünk ezt a helyet?
12:11
[Porzó hódeszkázás]
12:14
G: Persze, itt van néhány 360 fokos porzó hódeszkázó videó.
12:18
MS: Kezdő hódeszkázó vagyok,
12:21
remélhetőleg ez a videó segít tanulni.
12:23
Bár ez már sokkal nehezebbnek tűnik,
12:25
mint amire készen állok.
12:28
Mi volt a neve ennek a trükknek?
12:32
G: Ez egy hátsó 540-es fogóval.
12:36
SI: Az MI pontosan tudja, mit néz Max,
12:38
még gazdag videotartalmakban is,
12:40
és valós időben válaszol bármilyen kérdésre.
12:43
Max, biztos vagy benne, hogy ez Whistler?
12:46
MS: Shahram, fogalmam sincs róla.
12:48
Még sosem voltam itt, de derítsük ki.
12:52
Mit gondolsz, melyik pálya ez?
12:57
G: Valószínűleg az egyik gondozatlan pálya a csúcsnál,
13:00
vagy a West Ridge felső szakaszában a Bachelor-hegyen,
13:02
mivel közel vannak a csúcshoz,
13:04
és észak felé néz a Three Sisters és a Broken Top felé,
13:07
a háttérben láthatók kiemelkedő hegycsúcsok.
13:09
MS: Mount Bachelor, Oregon, megértettem.
13:11
SI: Rendben, szórakozzunk kicsit.
13:14
Hadd mesélje el az MI ezt a videót.
13:16
Valaki a közönségből adjon meg szórakoztató elbeszélési stílust,
13:19
például természeti dokumentumfilmest vagy ilyesmit.
13:22
Közönség: Morgan Freeman.
13:24
SI: Nem tudunk színészeket utánozni, de valamikor eljutunk oda is.
13:28
Más javaslatok?
13:30
Közönség: Film előzetes.
13:31
Közönség: Horror film.
13:33
SI: Horrorfilm.
13:34
Ez lesz... lehet, hogy szörnyű, de próbáljuk ki.
13:37
MS: Kissé sötét, de legyen ez.
13:40
Leírnád, hogy mit látsz
13:42
úgy, mintha túlságosan lelkes karakter lennél egy horrorfilmben?
13:49
G: Ó, drágám, ez egyszerűen csodálatos.
13:51
Elhagyatott hegyi táj.
13:52
Milyen kellemesen baljós.
13:54
Készülj fel hátborzongató táncra az ismeretlennel,
13:57
ahol minden széllökés jeges rémület és rejtőző árnyékok meséit suttogja.
14:01
MS: Gemini, ez nagyszerű.
14:03
Máskor pozitívabb dolgokkal folytatjuk.
14:06
SI: Max, tudom, hogy van egy utolsó demód,
14:08
és nyilván gyakoroltad a gazdálkodási készségedet?
14:12
MS: Igen, Shahram, izgatottan vártam,
14:14
hogy visszatérjek vidéki gyökereimhez,
14:17
és tehetem a kedvencem: játszhatok.
14:19
De teljesen új, következő szintű élménnyé válik
14:22
az MI társaságában,
14:23
aki mellettünk van játék közben.
14:25
és segít megtanulni, hogyan kell játszani az ilyen típusú játékokat.
14:29
Pl. mit kéne tennem itt ezután?
14:36
G: Úgy tűnik, hogy a Stardew Valley játék elején vagy.
14:39
Pénzt kell keresned, ezért próbálj meg néhány magot ültetni.
14:42
Először kapáld meg a talajt, majd ültess el magokat.
14:45
Úgy tűnik, van egy kis paszternák.
14:47
Mivel nem esik az eső,
14:48
kannából meg is kell öntözöd őket.
14:52
MS: Soknak tűnik, és talán egykor robotok megteszik ezt helyettünk,
14:55
de egyelőre később még be kell nézzek a farmomra.
14:58
Végül is, össze tudod foglalni játékos két mondatba,
15:01
mivel foglalkoztunk ma?
15:07
G: A digitális birodalom megszervezésétől indultunk,
15:09
átvágtunk a havas hegyeken,
15:11
sőt, időt szakítottunk virtuális paszternák termesztésre is.
15:14
Elég kalandos volt.
15:16
MS: Igazán jó kaland.
15:17
Kösz, Gemini.
15:18
(Taps)
15:24
SI: Fantasztikus, köszönöm Max.
15:26
Belépünk a számítástechnikai forradalom izgalmas új szakaszába.
15:30
A fejhallgató és a szemüveg csak a kezdet.
15:33
Mindez a jövő egyetlen jövőképére mutat, olyan világra,
15:36
ahol a hasznos MI konvergál a könnyű XR-rel.
15:41
Az XR eszközök hordozhatóbbá válnak,
15:44
azonnali hozzáférést biztosítva az információkhoz.
15:47
Míg az MI kontextuálisan tudatosabbá válik, beszélgetős,
15:51
személyre szabott lesz,
15:53
és a mi feltételeinek szerint nyelvünkön dolgozik velünk.
15:57
Már nem bővítjük a valóságunkat,
15:59
hanem inkább intelligenciánkat bővítjük.
16:02
Köszönöm szépen.
16:04
(Taps)
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment