Maaari bang matuto ng wika ang artificial intelligence tulad ng isang sanggol? Sinubukan ito ng mga mananaliksik sa pamamagitan ng pag-record ng footage mula sa buhay ng isang bata at pagpapakain nito sa isang AI system.
Ano ang mangyayari kapag sinanay mo ang isang artificial intelligence (AI) system sa parehong bilis ng isang sanggol?
Ang isang pangkat ng mga mananaliksik mula sa New York University (NYU) ay nilagyan ng isang sanggol na may naka-mount na camera sa ulo at nag-record ng mga video mula noong anim na buwang gulang ang bata hanggang sa kanilang ikalawang kaarawan.
Nagawa nilang itala ang humigit-kumulang isang porsyento ng mga oras ng paggising ng bata, na ginamit nila upang sanayin ang isang AI system o neural network – isang computational model na natututo ng mga pattern mula sa input data.
Inilathala nila ang kanilang mga natuklasan sa journal Agham.
Sa kabila ng medyo mababang halaga ng data na ito kumpara sa karaniwang napakalaking dataset na ginagamit upang sanayin ang AI, sapat na ito para sa pag-aaral ng wika.
“Ipinapakita namin, sa unang pagkakataon, na ang isang neural network na sinanay sa makatotohanang pag-unlad na ito mula sa isang bata ay matututong mag-link ng mga salita sa kanilang mga visual na katapat,” Wai Keen Vong, isang research scientist sa NYU’s Center for Data Science at ang papel ng papel. unang may-akda, sinabi sa isang pahayag.
“Ipinapakita ng aming mga resulta kung paano ang mga kamakailang algorithmic advances na ipinares sa naturalistic na karanasan ng isang bata ay may potensyal na baguhin ang aming pag-unawa sa maagang wika at pagkuha ng konsepto,” dagdag niya.
Isang tool upang malaman ang higit pa tungkol sa pag-aaral ng wika
Ang mga top-tier na AI system ay sumasailalim sa pagsasanay sa mga text dataset na naglalaman ng trilyong salita, habang ang mga bata ay nalantad lamang sa milyun-milyong salita taun-taon.
Sa pamamagitan ng paggamit ng mga modelo ng AI upang pag-aralan ang pag-aaral ng wika “maaari nating tugunan ang mga klasikong debate tungkol sa kung anong mga sangkap ang kailangan ng mga bata upang matuto ng mga salita – kung kailangan nila ng mga bias na partikular sa wika, likas na kaalaman, o pag-aaral lamang ng pag-uugnay upang magpatuloy,” sabi ni Brenden Lake, isang assistant professor sa NYU at ang senior author ng papel.
Ang mga mananaliksik ay may 60 oras na footage na naglalaman ng mga 250,000 salita na nakipag-ugnayan.
Ang mga salitang ito ay nauugnay sa mga video frame na kumukuha ng nakita ng bata noong binibigkas ang mga salitang iyon sa mga aktibidad gaya ng mga oras ng pagkain, pagbabasa ng mga libro, o oras ng paglalaro.
Pagkatapos ay gumamit ang mga mananaliksik ng dalawang module: isa para sa mga video frame at isa pa para sa na-transcribe na pagsasalita na nakadirekta sa bata.
Ang mga ito ay pinagsama at sinanay sa contrastive learning, isang uri ng machine learning na ginagamit upang sanayin ang modelo upang maunawaan ang mga ugnayan sa pagitan ng visual at linguistic cue.
Ang susunod na hakbang para sa mga mananaliksik ay subukan ang modelo – tinatawag na Child’s View for Contrastive Learning model (CVCL) – sa parehong paraan na sinukat nila ang pag-aaral ng salita ng mga sanggol.
Ipinakita nila sa modelo ang isang salita at apat na larawan, na hinihiling na pumili ito ng larawan na tumutugma sa salita.
Ang mga resulta ay nagsiwalat na ang modelo ay natuto ng maraming salita mula sa pang-araw-araw na buhay ng isang bata.
Ang sistema ay maaari ring maglapat ng ilang mga salita sa iba’t ibang mga larawan na hindi nakikita sa panahon ng pagsasanay, na natutunan din ng mga bata na gawin.
“Iminumungkahi ng mga natuklasan na ito na ang aspeto ng pag-aaral ng salita ay magagawa mula sa uri ng naturalistic na data na natatanggap ng mga bata habang gumagamit ng medyo generic na mga mekanismo sa pag-aaral tulad ng mga matatagpuan sa mga neural network,” sabi ni Lake.