Teknologi prototipe menyusut AI untuk menghadirkan fungsionalitas seperti otak dalam satu perangkat yang kuat - ScienceDaily
Teknologi

Pembelajaran mesin menjamin kinerja robot di wilayah yang tidak diketahui – ScienceDaily


Sebuah drone kecil melakukan uji terbang melalui ruang yang diisi dengan silinder karton yang ditempatkan secara acak yang bertindak sebagai penopang untuk pohon, orang, atau bangunan. Algoritme yang mengendalikan drone telah dilatih pada seribu simulasi lintasan sarat rintangan, tetapi tidak pernah terlihat seperti ini. Namun, sembilan kali dari 10, pesawat berukuran pint itu menghindari semua rintangan di jalurnya.

Eksperimen ini adalah tempat pembuktian untuk tantangan penting dalam robotika modern: kemampuan untuk menjamin keamanan dan keberhasilan robot otomatis yang beroperasi di lingkungan baru. Ketika para insinyur semakin beralih ke metode pembelajaran mesin untuk mengembangkan robot yang dapat beradaptasi, pekerjaan baru oleh para peneliti Universitas Princeton membuat kemajuan pada jaminan semacam itu untuk robot dalam konteks dengan beragam jenis hambatan dan kendala.

“Selama sekitar satu dekade terakhir, ada banyak kegembiraan dan kemajuan seputar pembelajaran mesin dalam konteks robotika, terutama karena memungkinkan Anda menangani input sensorik yang kaya,” seperti yang berasal dari kamera robot, dan memetakan input kompleks ini untuk tindakan, kata Anirudha Majumdar, asisten profesor teknik mesin dan dirgantara di Princeton.

Namun, algoritme kontrol robot yang didasarkan pada pembelajaran mesin berisiko mengalami overfitting pada data pelatihannya, yang dapat membuat algoritme menjadi kurang efektif saat menemukan input yang berbeda dari yang dilatihkan. Lab Robot Gerak Cerdas Majumdar menjawab tantangan ini dengan memperluas rangkaian alat yang tersedia untuk melatih kebijakan kontrol robot, dan mengukur kemungkinan keberhasilan dan keamanan robot yang bekerja di lingkungan baru.

Dalam tiga makalah baru, para peneliti mengadaptasi kerangka pembelajaran mesin dari arena lain ke bidang penggerak dan manipulasi robot. Mereka beralih ke teori generalisasi, yang biasanya digunakan dalam konteks yang memetakan satu masukan ke satu keluaran, seperti penandaan gambar otomatis. Metode baru ini adalah salah satu metode pertama yang menerapkan teori generalisasi ke tugas yang lebih kompleks untuk menjamin kinerja robot dalam pengaturan yang tidak biasa. Sementara pendekatan lain telah memberikan jaminan seperti itu di bawah asumsi yang lebih ketat, metode tim menawarkan jaminan yang dapat diterapkan secara lebih luas pada kinerja di lingkungan baru, kata Majumdar.

Pada makalah pertama, bukti prinsip penerapan framework machine learning, tim menguji pendekatan mereka dalam simulasi yang mencakup kendaraan beroda yang melewati ruang yang penuh dengan rintangan, dan lengan robotik yang menggenggam objek di atas meja. Mereka juga memvalidasi teknik dengan menilai penghindaran rintangan dari drone kecil yang disebut Parrot Swing (kombinasi quadcopter dan pesawat sayap tetap) saat terbang menyusuri koridor sepanjang 60 kaki yang dihiasi dengan silinder karton. Tingkat keberhasilan yang dijamin dari kebijakan kontrol drone adalah 88,4%, dan itu menghindari rintangan dalam 18 dari 20 percobaan (90%).

Karya, diterbitkan 3 Oktober di Jurnal Internasional Penelitian Robotika, Disusun bersama oleh Majumdar; Alec Farid, seorang mahasiswa pascasarjana di bidang teknik mesin dan ruang angkasa; dan Anoopkumar Sonar, konsentrator ilmu komputer dari Princeton’s Class of 2021.

Saat menerapkan teknik pembelajaran mesin dari area lain ke robotika, kata Farid, “ada banyak asumsi khusus yang perlu Anda penuhi, dan salah satunya adalah mengatakan seberapa mirip lingkungan yang Anda harapkan untuk dilihat dengan lingkungan kebijakan Anda. dilatih. Selain menunjukkan bahwa kami dapat melakukan ini dalam pengaturan robotik, kami juga berfokus pada upaya untuk memperluas jenis lingkungan yang dapat kami jamin. “

“Jenis jaminan yang dapat kami berikan berkisar dari sekitar 80% hingga 95% tingkat keberhasilan di lingkungan baru, bergantung pada tugas tertentu, tetapi jika Anda menerapkan [an unmanned aerial vehicle] dalam lingkungan nyata, 95% mungkin tidak cukup baik, “kata Majumdar.” Saya melihat itu sebagai salah satu tantangan terbesar, dan yang sedang kami garap secara aktif. “

Namun, pendekatan tim mewakili kemajuan yang sangat dibutuhkan dalam jaminan generalisasi untuk robot yang beroperasi di lingkungan yang tidak terlihat, kata Hongkai Dai, ilmuwan peneliti senior di Toyota Research Institute di Los Altos, California.

“Jaminan ini sangat penting untuk banyak aplikasi keselamatan kritis, seperti mobil tanpa pengemudi dan drone otonom, di mana set pelatihan tidak dapat mencakup setiap skenario yang mungkin,” kata Dai, yang tidak terlibat dalam penelitian tersebut. “Jaminan tersebut memberi tahu kami seberapa besar kemungkinan sebuah kebijakan masih dapat bekerja dengan baik pada kasus yang tidak terlihat, dan karenanya membangun kepercayaan pada kebijakan tersebut, di mana taruhan kegagalannya terlalu tinggi.”

Dalam dua makalah lainnya, yang akan dipresentasikan pada 18 November di Konferensi Virtual tentang Pembelajaran Robot, para peneliti memeriksa perbaikan tambahan untuk membawa kebijakan kendali robot lebih dekat ke jaminan yang akan dibutuhkan untuk penyebaran dunia nyata. Satu makalah menggunakan pembelajaran imitasi, di mana seorang “ahli” manusia memberikan data pelatihan dengan memandu robot simulasi secara manual untuk mengambil berbagai objek atau bergerak melalui ruang yang berbeda dengan rintangan. Pendekatan ini dapat meningkatkan keberhasilan kebijakan kontrol berbasis pembelajaran mesin.

Untuk memberikan data pelatihan, penulis utama Allen Ren, seorang mahasiswa pascasarjana di bidang teknik mesin dan kedirgantaraan, menggunakan mouse komputer 3D untuk mengontrol lengan robot simulasi yang ditugaskan untuk memegang dan mengangkat mug minum dengan berbagai ukuran, bentuk, dan bahan. Eksperimen pembelajaran imitasi lainnya melibatkan lengan mendorong kotak ke seberang meja, dan simulasi robot beroda yang menavigasi furnitur di lingkungan seperti rumah.

Para peneliti menerapkan kebijakan yang dipelajari dari tugas menggenggam mug dan mendorong kotak pada lengan robotik di laboratorium, yang mampu mengambil 25 mug berbeda dengan menggenggam pinggirannya di antara dua gripper yang seperti jari – bukan memegang pegangan. seperti yang dilakukan manusia. Dalam contoh mendorong kotak, kebijakan mencapai 93% keberhasilan pada tugas yang lebih mudah dan 80% pada tugas yang lebih sulit.

“Kami memiliki kamera di atas meja yang melihat lingkungan dan mengambil gambar lima kali per detik,” kata Ren. “Simulasi pelatihan kebijakan kami mengambil gambar ini dan mengeluarkan jenis tindakan apa yang harus diambil robot, dan kemudian kami memiliki pengontrol yang menggerakkan lengan ke lokasi yang diinginkan berdasarkan keluaran model.”

Makalah ketiga mendemonstrasikan pengembangan perencana berbasis visi yang memberikan jaminan bagi robot terbang atau berjalan untuk melakukan urutan gerakan yang direncanakan melalui lingkungan yang beragam. Menghasilkan kebijakan kontrol untuk gerakan yang direncanakan membawa masalah skala baru – kebutuhan untuk mengoptimalkan kebijakan berbasis visi dengan ribuan, bukan ratusan, dimensi.

“Itu membutuhkan beberapa alat algoritmik baru untuk dapat menangani dimensi itu dan masih dapat memberikan jaminan generalisasi yang kuat,” kata penulis utama Sushant Veer, rekan penelitian pascadoktoral di bidang teknik mesin dan ruang angkasa.

Aspek kunci dari strategi Veer adalah penggunaan gerakan primitif, di mana kebijakan mengarahkan robot untuk berjalan lurus atau berbelok, misalnya, daripada menentukan torsi atau kecepatan untuk setiap gerakan. Mempersempit ruang dari kemungkinan tindakan membuat proses perencanaan lebih mudah dikerjakan secara komputasi, kata Majumdar.

Veer dan Majumdar mengevaluasi perencana berbasis visi pada simulasi drone yang menavigasi di sekitar rintangan dan robot berkaki empat melintasi medan kasar dengan kemiringan setinggi 35 derajat – “masalah yang sangat menantang yang masih dicoba oleh banyak orang di bidang robotika untuk dipecahkan, “kata Veer.

Dalam penelitian tersebut, robot berkaki mencapai tingkat keberhasilan 80% di lingkungan pengujian yang tidak terlihat. Para peneliti sedang bekerja untuk lebih meningkatkan jaminan kebijakan mereka, serta menilai kinerja kebijakan pada robot nyata di laboratorium.

Pekerjaan itu sebagian didukung oleh US Office of Naval Research, National Science Foundation, Google Faculty Research Award, dan Amazon Research Award.

Dipersembahkan Oleh : Lapak Judi

Baca Juga : Data Sidney