Teknologi prototipe menyusut AI untuk menghadirkan fungsionalitas seperti otak dalam satu perangkat yang kuat - ScienceDaily
Offbeat

Menunjukkan robot cara mengemudikan mobil … hanya dalam beberapa pelajaran mudah – ScienceDaily


Bayangkan jika robot dapat belajar dari menonton demonstrasi: Anda dapat menunjukkan kepada robot domestik bagaimana melakukan pekerjaan rutin atau mengatur meja makan. Di tempat kerja, Anda dapat melatih robot seperti karyawan baru, menunjukkan kepada mereka cara melakukan banyak tugas. Di jalan, mobil yang dapat mengemudi sendiri Anda dapat belajar mengemudi dengan aman dengan melihat Anda mengemudi di sekitar lingkungan Anda.

Membuat kemajuan pada visi itu, peneliti USC telah merancang sistem yang memungkinkan robot secara mandiri mempelajari tugas-tugas rumit dari sejumlah kecil demonstrasi – bahkan yang tidak sempurna. Makalah, berjudul Belajar dari Demonstrasi Menggunakan Signal Temporal Logic, dipresentasikan pada Conference on Robot Learning (CoRL), 18 November.

Sistem peneliti bekerja dengan mengevaluasi kualitas setiap demonstrasi, sehingga belajar dari kesalahan yang dilihatnya, serta keberhasilannya. Sementara metode mutakhir saat ini membutuhkan setidaknya 100 demonstrasi untuk menyelesaikan tugas tertentu, metode baru ini memungkinkan robot untuk belajar hanya dari segelintir demonstrasi. Hal ini juga memungkinkan robot untuk belajar lebih intuitif, cara manusia belajar dari satu sama lain – Anda melihat seseorang melaksanakan tugas, bahkan tidak sempurna, lalu mencoba sendiri. Tidak harus menjadi demonstrasi yang “sempurna” bagi manusia untuk mendapatkan pengetahuan dengan saling mengamati.

“Banyak sistem pembelajaran mesin dan pembelajaran penguatan memerlukan data data dalam jumlah besar dan ratusan demonstrasi – Anda memerlukan manusia untuk mendemonstrasikannya berulang kali, yang tidak mungkin dilakukan,” kata penulis utama Aniruddh Puranic, Ph.D. mahasiswa ilmu komputer di USC Viterbi School of Engineering.

“Selain itu, kebanyakan orang tidak memiliki pengetahuan pemrograman untuk secara eksplisit menyatakan apa yang dibutuhkan robot, dan manusia tidak mungkin mendemonstrasikan semua yang perlu diketahui robot. Bagaimana jika robot menemukan sesuatu yang belum pernah dilihat sebelumnya? tantangan utama. “

Belajar dari demonstrasi

Belajar dari demonstrasi menjadi semakin populer dalam mendapatkan kebijakan kontrol robot yang efektif – yang mengontrol pergerakan robot – untuk tugas-tugas kompleks. Tetapi hal ini rentan terhadap ketidaksempurnaan dalam demonstrasi dan juga menimbulkan masalah keamanan karena robot dapat mempelajari tindakan yang tidak aman atau tidak diinginkan.

Selain itu, tidak semua demonstrasi sama: beberapa demonstrasi merupakan indikator yang lebih baik untuk perilaku yang diinginkan daripada yang lain dan kualitas demonstrasi sering kali bergantung pada keahlian pengguna yang menyediakan demonstrasi.

Untuk mengatasi masalah ini, para peneliti mengintegrasikan “logika temporal sinyal” atau STL untuk mengevaluasi kualitas demonstrasi dan secara otomatis memberi peringkat untuk menciptakan penghargaan yang melekat.

Dengan kata lain, meskipun beberapa bagian dari demonstrasi tidak masuk akal berdasarkan persyaratan logika, dengan menggunakan metode ini, robot masih dapat belajar dari bagian yang tidak sempurna. Di satu sisi, sistem sampai pada kesimpulannya sendiri tentang keakuratan atau keberhasilan demonstrasi.

“Katakanlah robot belajar dari berbagai jenis demonstrasi – bisa berupa demonstrasi langsung, video, atau simulasi – jika saya melakukan sesuatu yang sangat tidak aman, pendekatan standar akan melakukan salah satu dari dua hal: baik, mereka akan sepenuhnya mengabaikannya, atau lebih buruk lagi, robot akan mempelajari hal yang salah, “kata rekan penulis Stefanos Nikolaidis, asisten profesor ilmu komputer USC Viterbi.

“Sebaliknya, dengan cara yang sangat cerdas, karya ini menggunakan beberapa penalaran akal sehat berupa logika untuk memahami bagian mana dari demonstrasi yang baik dan bagian mana yang tidak. Intinya, inilah yang juga dilakukan oleh manusia.”

Ambil contoh, demonstrasi mengemudi di mana seseorang melewatkan tanda berhenti. Ini akan diberi peringkat lebih rendah oleh sistem daripada demonstrasi pengemudi yang baik. Namun, jika selama demonstrasi ini, pengemudi melakukan sesuatu yang cerdas – misalnya menginjak rem untuk menghindari tabrakan – robot tetap akan belajar dari tindakan cerdas ini.

Beradaptasi dengan preferensi manusia

Logika temporal sinyal adalah bahasa simbolik matematika ekspresif yang memungkinkan penalaran robotik tentang hasil saat ini dan masa depan. Sementara penelitian sebelumnya di bidang ini telah menggunakan “logika temporal linier,” STL lebih disukai dalam kasus ini, kata Jyo Deshmukh, mantan insinyur Toyota dan asisten profesor ilmu komputer USC Viterbi.

“Saat kita masuk ke dunia sistem fisik cyber, seperti robot dan mobil yang mengemudi sendiri, di mana waktu sangat penting, logika temporal linier menjadi sedikit rumit, karena alasan tentang urutan nilai benar / salah untuk variabel, sementara STL memungkinkan penalaran tentang sinyal fisik. “

Puranic, yang dinasehati oleh Deshmukh, mengemukakan ide tersebut setelah mengikuti kelas robotika langsung dengan Nikolaidis, yang telah mengembangkan robot untuk belajar dari video YouTube. Ketiganya memutuskan untuk mengujinya. Ketiganya mengatakan mereka terkejut dengan tingkat keberhasilan sistem dan kedua profesor tersebut memuji Puranic atas kerja kerasnya.

“Dibandingkan dengan algoritme canggih, yang digunakan secara luas di banyak aplikasi robotika, Anda melihat urutan perbedaan besarnya dalam berapa banyak demonstrasi yang diperlukan,” kata Nikolaidis.

Sistem ini diuji menggunakan simulator game bergaya Minecraft, tetapi para peneliti mengatakan sistem tersebut juga dapat belajar dari simulator mengemudi dan bahkan video. Selanjutnya, para peneliti berharap untuk mencobanya pada robot sungguhan. Mereka mengatakan pendekatan ini sangat cocok untuk aplikasi di mana peta telah diketahui sebelumnya tetapi terdapat hambatan dinamis di peta: robot di lingkungan rumah tangga, gudang atau bahkan penjelajah eksplorasi ruang angkasa.

“Jika kita ingin robot menjadi rekan tim yang baik dan membantu orang, pertama-tama mereka perlu belajar dan beradaptasi dengan preferensi manusia dengan sangat efisien,” kata Nikolaidis. “Metode kami menyediakan itu.”

“Saya senang untuk mengintegrasikan pendekatan ini ke dalam sistem robotik untuk membantu mereka belajar secara efisien dari demonstrasi, tetapi juga secara efektif membantu rekan satu tim dalam tugas kolaboratif.”

Dipersembahkan Oleh : Lapak Judi

Baca Juga : Hongkong Prize