ADK для Kotlin: Створення ШІ-агентів на Android та JVM

Інформатек Діджитал » Ресурси » Повний посібник з комплекту розробки агентів (ADK) для Kotlin

Фреймворк з відкритим кодом для розробки складних та масштабованих агентів штучного інтелекту.
Вбудована підтримка локального виконання на пристроях Android через Gemini Nano.
Здатність оркеструвати багатоагентні системи шляхом поєднання хмарних та локальних моделей.
Гнучка екосистема, що дозволяє інтеграцію налаштованих інструментів та стандартів MCP.

Якщо ви захоплюєтеся штучним інтелектом та програмуванням на Kotlin, приготуйтеся, адже Agent Development Kit (ADK) тут, щоб зробити речі цікавими. По суті, це інструментарій з відкритим кодом що дозволяє вам розробляти агентів штучного інтелекту з повним контролем, незалежно від того, чи працюють вони на вашому власному комп’ютері, у Google Cloud чи безпосередньо на мобільному пристрої користувача.

Найпотужнішим аспектом цієї структури є те, що вона обирає підхід "код перш за все"Забудьте про нудні налаштування у зовнішніх інтерфейсах; тут ви визначаєте поведінку, логіку оркестрації та використання інструментів безпосередньо в коді, що робить його налагодження та встановлення версій ваших агентів бути прогулянкою в парку порівняно з іншими методами.

Реалізація в екосистемі Android

Впровадження штучного інтелекту на мобільні пристрої – це те, де ADK справді сяє. Завдяки оптимізованим залежностям для середовища Android ви можете створювати інтерфейси, які пріоритезувати конфіденційність і вони мають дуже низьку затримку, оскільки не залежать від постійного підключення до Інтернету.

Щоб розпочати, вам знадобиться Android Studio та оновлений Android SDK (принаймні compileSdk 34 та minSdk 24У файлі конфігурації Gradle вам потрібно буде додати бібліотеку google-adk-kotlin-core-android та процесор анотацій KSP. Важливою деталлю є те, що Не слід їх змішувати. Залежність Android від JVM обмежена, оскільки мобільна версія вже містить усе необхідне та певну сумісність з моделями пристроїв.

Візуальне програмування: майбутнє кодування

Синтаксис визначення агента дуже інтуїтивно зрозумілий. Анотації, такі як @Tool y @Param щоб вказати, які можливості має агент. Наприклад, ви можете створити сервіс, який надає поточний час у місті, і пов’язати його з LlmAgent налаштований з такою моделлю, як Gemini Flash. Однак будьте дуже обережні з безпекою: Ніколи не вводьте ключі API безпосередньо в коді клієнтського застосунку; в ідеалі використовуйте власний бекенд або Firebase AI Logic, щоб уникнути розголошення своїх облікових даних світу.

Щоб запустити агента всередині активності Android або ViewModel, використовується InMemoryRunnerЦей компонент дозволяє зібрати відповіді від агента за допомогою корутин Kotlin, що забезпечує оновлення інтерфейсу користувача в режимі реального часу, поки агент обробляє запит користувача.

Gemini Nano та локальні моделі

Однією з перлин корони є інтеграція з Близнюки Нано через API ML Kit. Замість виклику віддаленої моделі можна використовувати клас GenaiPrompt щоб можна було зробити висновок повністю на пристроїЦе чисте золото для програм, які обробляють конфіденційні дані або які потрібно запускати в режимі польоту.

Найцікавіше те, що ви можете грати в роль архітектора штучного інтелекту та створювати багатоагентні системиУявіть собі схему, де потужна хмарна модель виступає в ролі оркеструючого мозку та делегує більш приватні або швидші завдання місцеві субагенти що працюють на пристрої. Така структура дозволяє вертикальне масштабування від простої утиліти до складного багатоагентного застосунку.

Абстрактні синтаксичні дерева в програмуванні: повний посібник

Розробка в JVM та розширених інструментах

Якщо ви не розробляєте для Android, ADK також чудово підійде для JVM. Щоб розпочати, вам потрібні лише Java 17 та Gradle 8.0. Робочий процес схожий: ви визначаєте свого агента та використовуєте ReplRunner взаємодіяти з ним з консолі або, якщо ви віддаєте перевагу чомусь більш візуальному, ви можете підняти AdkWebServer протестувати все в інтерфейсі веб-чату на порту 8080.

Що стосується можливостей, ADK не обмежується генерацією тексту. інструменти Вони дозволяють агенту взаємодіяти з реальним світом. Існують Function ToolsЦе локальні функції та підтримка серверів MCP (Model Context Protocol), що значно розширює діапазон дій, які може виконувати агент.

Для тих, хто прагне максимальної ефективності, існують розширені реалізації, які інтегрують CodeGraph для навігації графом викликів коду, що значно зменшує споживання токенів під час дослідження. Крім того, можливість використовувати різні постачальники LLM (таких як OpenAI, Anthropic або Ollama) робить фреймворк надзвичайно універсальним і не залежить виключно від однієї екосистеми.

Комплект розробки агентів для Kotlin позиціонує себе як надійне рішення, що об'єднує потужність мовних моделей з гнучкістю Kotlin, дозволяючи... швидкі прототипи в JVM включаючи складні та приватні розгортання на Android за допомогою Gemini Nano та інтелектуальне управління інструментами та мультиагентами.

Зміст

Реалізація в екосистемі Android
Gemini Nano та локальні моделі
Розробка в JVM та розширених інструментах