- DeepMind menggunakan pembelajaran mendalam dan penguatan untuk memecahkan tugas-tugas rumit.
- Model seperti AlphaGo dan AlphaFold telah merevolusi permainan dan pengobatan.
- Veo memungkinkan pembuatan video realistis dengan teks atau gambar sederhana.
- Alat seperti Gemma Scope membantu memahami cara berpikir AI.
Kecerdasan buatan Google telah menarik perhatian seluruh dunia berkat kemajuannya yang mengejutkan, dan di antara perusahaan-perusahaan terkemuka di bidang ini, Google DeepMind menonjol sebagai salah satu yang paling inovatif. Didirikan pada tahun 2010 dan diakuisisi oleh Google pada tahun 2014, perusahaan yang berbasis di Inggris ini telah mengembangkan berbagai teknologi yang telah meninggalkan jejak di berbagai bidang seperti kedokteran, efisiensi energi, permainan, dan bahkan pembuatan konten audiovisual.
Tapi apa sebenarnya DeepMind dan bagaimana Anda dapat menggunakannya? Untuk memahami cara kerjanya, kegunaannya dalam kehidupan nyata, dan dampaknya pada kehidupan sehari-hari, mari kita selidiki sejarahnya, struktur teknologinya, perkembangan utamanya, dan bagaimana kita sekarang melihat penerapan nyata dari ide-ide ini yang tampak seperti fiksi ilmiah bertahun-tahun yang lalu.
Apa itu DeepMind dan dari mana asalnya?
DeepMind adalah laboratorium penelitian kecerdasan buatan yang misinya adalah mengembangkan sistem yang dapat belajar secara mandiri dan memecahkan masalah tanpa perlu aturan yang telah diprogram sebelumnya. Sistem ini diciptakan oleh tiga peneliti Inggris yang berpengalaman di bidang ilmu saraf dan ilmu komputer. Pendekatan disruptifnya terhadap AI dengan cepat menarik perhatian, sedemikian rupa sehingga Google (sekarang Alphabet) membeli perusahaan tersebut dengan harga hampir 400 juta poundsterling pada tahun 2014.
Sejak itu, DeepMind telah berkembang menjadi tim yang terdiri dari lebih dari 700 profesional tersebar di berbagai kantor di seluruh dunia. Dengan akses ke infrastruktur teknis Google, mereka mampu memperluas riset mereka ke berbagai bidang seperti kedokteran, efisiensi energi, ilmu saraf, robotika, dan algoritma yang diterapkan pada gim.
Cara kerja teknologi di balik DeepMind
Inti dari AI DeepMind didasarkan pada dua pilar fundamental: pembelajaran mendalam dan pembelajaran penguatanJaringan saraf yang mereka kembangkan dirancang untuk meniru fungsi otak manusia melalui lapisan-lapisan simpul yang saling terhubung yang belajar dari data.
Salah satu pendekatan utama yang digunakan adalah pembelajaran Q bebas model, sebuah teknik di mana sistem menyesuaikan responsnya untuk memaksimalkan imbalan yang diterima. Bentuk pelatihan ini memungkinkan DeepMind untuk berkembang dalam lingkungan yang kompleks tanpa instruksi yang telah ditentukan sebelumnya.
Misalnya, mereka melatih AI mereka dengan permainan video Atari. Awalnya dia tidak tahu cara bermain, tetapi setelah jutaan pengulangan dia berhasil mengalahkan pemain manusia.Hal ini dimungkinkan karena AI mampu mengidentifikasi pola optimal dan memperbaiki kesalahan seiring berjalannya waktu.
Pencapaian penting DeepMind di berbagai bidang
Sejak awal berdirinya, DeepMind telah mencapai perkembangan terobosan di bidang kecerdasan buatan. Berikut beberapa perkembangan terpentingnya:
AlphaGo: Menguasai Hal yang Mustahil
Permainan papan Go dikenal karena kompleksitas strategisnya yang luar biasa. DeepMind mengembangkan AlphaGo, AI pertama yang mengalahkan pemain manusia profesional dan kemudian juara dunia pada tahun 2016. Prestasi ini menunjukkan bahwa AI dapat menangani tugas-tugas yang memerlukan intuisi, kreativitas, dan pemikiran strategis jangka panjang.
AlphaFold: merevolusi pengobatan
Salah satu kemajuan yang paling mengganggu adalah AlphaFold, AI yang mampu memprediksi bagaimana protein terlipat, sebuah masalah biologis yang belum terpecahkan selama beberapa dekade. Alat ini telah memfasilitasi pengembangan pengobatan dan obat baru, bahkan membantu dalam memerangi COVID-19 dan penyakit seperti Alzheimer.
AlphaZero: Sistem yang mendominasi banyak permainan
AlphaZero mampu belajar dan bermain pada tingkat ahli dalam catur, shogi, dan Go. Ia tidak memerlukan data sebelumnya: ia hanya belajar dari bermain dengan dirinya sendiri jutaan kali.Dalam beberapa hari, ia mengungguli mesin catur tercanggih di dunia seperti Stockfish.
DeepMind dalam efisiensi energi
AI DeepMind juga telah meningkatkan cara kita menggunakan sumber daya. Diterapkan di pusat data Google, ini mengurangi konsumsi energi pendinginan hingga 40%. berkat sistem pembelajaran penguatan yang dioptimalkan secara real time.
Kemajuan dalam robotika
DeepMind telah mengerjakan robot seperti Robocat, mampu belajar mengoperasikan berbagai lengan robot Hanya dengan beberapa demonstrasi. Sistem ini dilatih dengan data yang dihasilkan sendiri, yang meningkatkan efisiensinya saat menghadapi tantangan baru.
Batas Baru: AI Generatif dengan DeepMind
Salah satu fitur baru yang paling mencolok adalah Veo, model AI generatif untuk video. Dipresentasikan pada acara Google I/O 2024 dan menjanjikan transformasi kreasi audiovisual.
Apa yang dapat Veo lakukan?
Veo mampu menghasilkan video 1080p berkualitas tinggi dalam berbagai konteks dari teks, gambar, atau rangkaian video sebelumnya.Kemampuan intuitifnya untuk menangkap detail yang kompleks menjadikannya alat yang ideal bagi para kreator, pembuat film, dan pengiklan.
Ia menawarkan fungsi-fungsi seperti:
- Edisi Bertopeng: Memungkinkan Anda memodifikasi area tertentu pada video yang ada.
- Membuat video berbasis gambar:Dari gambar dan teks, dihasilkan sebuah video yang memiliki koherensi estetika dan naratif.
- Perluasan klip: Buat video berdurasi lebih dari 60 detik dengan kontinuitas visual.
Kasus Penggunaan Veo di Dunia Nyata
Pembuat film Donald Glover bekerja sama dengan Google untuk menguji kemampuan kreatif Veo. Mereka menggunakan AI ini untuk memvisualisasikan rekaman yang rumit sebelum memfilmkannya., menghemat waktu dan sumber daya. Pratinjau cepat ini memungkinkan tim untuk menyesuaikan bidikan dan fokus terlebih dahulu, sehingga meningkatkan standar produksi.
Ini juga telah digunakan dalam periklanan, pendidikan, dan bahkan pengobatan. Veo dapat mensimulasikan lingkungan yang realistis untuk pelatihan atau membuat video pendidikan yang berdampak. yang memudahkan pemahaman topik yang rumit.
Bagaimana cara kerja Veo?
Model ini menggabungkan beberapa teknologi sebelumnya seperti Generative Query Network, Image-Video dan VideoPoet. Ia menggunakan enkoder untuk teks dan gambar dan menggabungkannya menjadi masukan tunggal yang melewati model difusi laten.Ini menghasilkan video terkompresi yang didekode dalam resolusi tinggi.
Selain itu, Semua video memiliki tanda air tak terlihat menggunakan SynthID, alat milik perusahaan yang memastikan konten yang dihasilkan AI dapat dilacak dan aman.
Gemma Scope: Memahami Cara Berpikir AI
Salah satu tantangan AI adalah mengetahui secara pasti apa yang terjadi di dalamnya. Untuk memecahkan misteri ini, tim DeepMind telah mengembangkan Gemma Scope, sebuah alat di bidang interpretabilitas mekanistikFungsinya adalah untuk menunjukkan bagaimana AI mencapai kesimpulannya.
Dengan menggunakan sparse autoencoder, dimungkinkan melihat neuron mana yang diaktifkan oleh rangsangan tertentu, seolah-olah kita sedang mengamati otak AI di bawah mikroskop. Misalnya, menanyakan tentang chihuahua dapat memicu pola "anjing".
Alat-alat ini membantu mendeteksi kesalahan dan bias internalMisalnya, jika sebuah model menyatakan 9.11 lebih besar dari 9.8, itu karena model tersebut secara keliru mengaitkan angka-angka tersebut dengan ayat-ayat Alkitab atau tanggal-tanggal seperti 11/XNUMX. Dengan informasi ini, para insinyur dapat menyesuaikan perilaku yang salah.
Fungsi seperti mendeteksi perasaan manusia juga telah dieksplorasi, seperti rasa malu orang lain, atau bahkan penipuan, meskipun yang terakhir tetap sulit diisolasi.
DeepMind telah membuka alat-alat ini untuk umum melalui GitHub dan platform seperti Neuronpedia. Hal ini memungkinkan lebih banyak pakar untuk berkolaborasi guna memahami cara kerja model dan merekayasa balik algoritmanya.
Berkat evolusi DeepMind yang konstanTeknologi mereka telah melampaui riset dan menjadi solusi yang dapat diterapkan untuk berbagai masalah dunia nyata, mulai dari penemuan obat hingga film dan pendidikan. Pendekatan etis mereka, komitmen terhadap transparansi, dan penciptaan perangkat yang memungkinkan kita memahami AI menunjukkan bahwa masih banyak yang perlu dieksplorasi, dan bahwa kita baru menyentuh permukaan potensi kecerdasan buatan jenis ini.