- เฟรมเวิร์กโอเพนซอร์สสำหรับออกแบบเอเจนต์ AI ที่ซับซ้อนและปรับขนาดได้
- รองรับการเรียกใช้งานแบบโลคอลบนอุปกรณ์ Android โดยตรงผ่าน Gemini Nano
- ความสามารถในการจัดการระบบหลายเอเจนต์โดยการผสมผสานโมเดลคลาวด์และโมเดลภายในองค์กร
- ระบบนิเวศที่มีความยืดหยุ่นซึ่งช่วยให้สามารถบูรณาการเครื่องมือที่ปรับแต่งได้และมาตรฐาน MCP เข้าด้วยกันได้
ถ้าคุณสนใจปัญญาประดิษฐ์และการเขียนโปรแกรม Kotlin เตรียมตัวให้พร้อม เพราะ Agent Development Kit (ADK) มาแล้วที่จะทำให้ทุกอย่างน่าสนใจยิ่งขึ้น โดยพื้นฐานแล้วมันคือ... ชุดเครื่องมือโอเพนซอร์ส ซึ่งช่วยให้คุณออกแบบเอเจนต์ AI ได้อย่างสมบูรณ์ ไม่ว่าจะใช้งานบนคอมพิวเตอร์ของคุณเอง บน Google Cloud หรือบนอุปกรณ์มือถือของผู้ใช้โดยตรง
จุดเด่นที่สุดของกรอบแนวคิดนี้คือการเลือกใช้วิธีการ "เขียนโค้ดก่อน"ลืมการตั้งค่าที่ยุ่งยากในอินเทอร์เฟซภายนอกไปได้เลย ที่นี่คุณสามารถกำหนดพฤติกรรม ตรรกะการจัดการ และการใช้งานเครื่องมือได้โดยตรงในโค้ด ทำให้ง่ายขึ้นมาก ดีบักและกำหนดเวอร์ชันเอเจนต์ของคุณ เมื่อเทียบกับวิธีการอื่นๆ แล้ว ถือว่าง่ายมาก
การนำไปใช้งานในระบบนิเวศของ Android
การนำ AI มาสู่อุปกรณ์พกพาคือจุดเด่นที่แท้จริงของ ADK ด้วยการปรับแต่งส่วนประกอบต่างๆ ให้เหมาะสมกับสภาพแวดล้อม Android คุณจึงสามารถสร้างประสบการณ์ที่... ให้ความสำคัญกับความเป็นส่วนตัว และมีความหน่วงต่ำมาก เนื่องจากไม่จำเป็นต้องมีการเชื่อมต่ออินเทอร์เน็ตอย่างต่อเนื่อง
ในการเริ่มต้น คุณต้องมี Android Studio และ Android SDK เวอร์ชันล่าสุด (อย่างน้อย) compileSdk 34 และ minSdk 24ในไฟล์การกำหนดค่า Gradle คุณจะต้องเพิ่มไลบรารี google-adk-kotlin-core-android และตัวประมวลผลคำอธิบายประกอบ KSP รายละเอียดที่สำคัญคือ คุณไม่ควรผสมพวกมันเข้าด้วยกัน ความพึ่งพาของ Android ต่อ JVM นั้นมีจำกัด เนื่องจากเวอร์ชันสำหรับมือถือได้รวมทุกสิ่งที่จำเป็นไว้แล้ว และมีความเข้ากันได้กับอุปกรณ์แต่ละรุ่นโดยเฉพาะ
เมื่อกำหนดเอเจนต์ ไวยากรณ์นั้นเข้าใจง่ายมาก คำอธิบายประกอบเช่น @Tool y @Param เพื่อระบุถึงความสามารถที่เอเจนต์มี ตัวอย่างเช่น คุณสามารถสร้างบริการที่แสดงเวลาปัจจุบันในเมืองหนึ่งๆ และเชื่อมโยงเข้ากับ... แอลแอลเอ็มเอเจนต์ ตั้งค่าด้วยโมเดลอย่างเช่น Gemini Flash อย่างไรก็ตาม ต้องระมัดระวังเรื่องความปลอดภัยเป็นอย่างมาก: ห้ามป้อนรหัส API เด็ดขาด โดยตรงในโค้ดแอปพลิเคชันฝั่งไคลเอ็นต์; ทางที่ดีควรใช้แบ็กเอนด์ของคุณเองหรือ Firebase AI Logic เพื่อหลีกเลี่ยงการเปิดเผยข้อมูลประจำตัวของคุณสู่สาธารณะ
ในการเรียกใช้เอเจนต์ภายใน Android activity หรือ ViewModel คุณจะต้องใช้ InMemoryRunnerส่วนประกอบนี้ช่วยให้ รวบรวมคำตอบ จากเอเจนต์ที่ใช้ Kotlin coroutines ซึ่งช่วยให้สามารถอัปเดตส่วนติดต่อผู้ใช้แบบเรียลไทม์ได้ในขณะที่เอเจนต์กำลังประมวลผลคำขอของผู้ใช้
Gemini Nano และรุ่นท้องถิ่น
หนึ่งในจุดเด่นสำคัญคือการบูรณาการกับ ราศีเมถุนนาโน ผ่านทาง API ของ ML Kit แทนที่จะเรียกใช้โมเดลระยะไกล คุณสามารถใช้คลาสได้ GenaiPrompt เพื่อให้สามารถสรุปผลได้ ขึ้นอยู่กับอุปกรณ์ทั้งหมดนี่คือสุดยอดเครื่องมือสำหรับแอปพลิเคชันที่จัดการข้อมูลที่ละเอียดอ่อน หรือแอปพลิเคชันที่จำเป็นต้องทำงานในโหมดเครื่องบิน
สิ่งที่น่าสนใจที่สุดคือ คุณสามารถสวมบทบาทเป็นสถาปนิก AI และสร้างสิ่งต่างๆ ได้ ระบบหลายเอเจนต์ลองนึกภาพระบบที่ใช้โมเดลบนคลาวด์อันทรงพลังเป็นเสมือนสมองส่วนกลางในการควบคุม และมอบหมายงานที่ต้องการความเป็นส่วนตัวหรือรวดเร็วกว่าให้กับระบบอื่น ตัวแทนย่อยในพื้นที่ ที่ทำงานบนอุปกรณ์ โครงสร้างนี้ช่วยให้สามารถปรับขนาดในแนวตั้งได้ ตั้งแต่โปรแกรมยูทิลิตี้อย่างง่ายไปจนถึงแอปพลิเคชันแบบหลายเอเจนต์ที่ซับซ้อน
การพัฒนาด้วย JVM และเครื่องมือขั้นสูง
หากคุณไม่ได้พัฒนาแอปพลิเคชันสำหรับ Android, ADK ก็ยังโดดเด่นใน JVM ด้วยเช่นกัน ในการเริ่มต้น คุณต้องการเพียง Java 17 และ Gradle 8.0 เท่านั้น ขั้นตอนการทำงานก็คล้ายกัน: คุณกำหนดเอเจนต์ของคุณและใช้งาน... ReplRunner เพื่อโต้ตอบกับมันจากคอนโซล หรือหากคุณต้องการอะไรที่ดูสวยงามกว่า คุณสามารถยกมันขึ้นได้ แอดเคเว็บเซิร์ฟเวอร์ เพื่อทดสอบทุกอย่างในอินเทอร์เฟซแชทบนเว็บผ่านพอร์ต 8080
ในแง่ของความสามารถ ADK ไม่ได้จำกัดอยู่แค่การสร้างข้อความเท่านั้น เครื่องมือ สิ่งเหล่านี้ช่วยให้เอเจนต์สามารถโต้ตอบกับโลกแห่งความเป็นจริงได้ มีอยู่ Function Toolsนี่คือฟังก์ชันภายในเครื่อง และการสนับสนุนเซิร์ฟเวอร์ MCP (Model Context Protocol) ซึ่งช่วยขยายขอบเขตการกระทำที่เอเจนต์สามารถทำได้ให้กว้างขึ้นอย่างมาก
สำหรับผู้ที่ต้องการประสิทธิภาพสูงสุด มีการใช้งานขั้นสูงที่ผสานรวมเข้าด้วยกัน โค้ดกราฟ เพื่อนำทางกราฟการเรียกใช้โค้ด ลดการใช้โทเค็นลงอย่างมากในระหว่างการสำรวจ นอกจากนี้ ความสามารถในการใช้งาน ผู้ให้บริการ LLM ต่างๆ (เช่น OpenAI, Anthropic หรือ Ollama) ทำให้เฟรมเวิร์กมีความยืดหยุ่นสูงและไม่ขึ้นอยู่กับระบบนิเวศใดระบบนิเวศหนึ่งโดยเฉพาะ
ชุดพัฒนาเอเจนต์สำหรับ Kotlin วางตำแหน่งตัวเองเป็นโซลูชันที่แข็งแกร่งซึ่งผสานพลังของโมเดลภาษาเข้ากับความยืดหยุ่นของ Kotlin ทำให้สามารถ... การสร้างต้นแบบอย่างรวดเร็วใน JVM รวมถึงการใช้งานระบบที่ซับซ้อนและเป็นส่วนตัวบน Android โดยใช้ Gemini Nano และการจัดการเครื่องมือและเอเจนต์หลายตัวอย่างชาญฉลาด

