Lokal na AI at automation: mga ahente, seguridad, at mga kaso sa totoong mundo

Huling pag-update: Mayo 17 2026
May-akda: TecnoDigital
  • Binibigyang-daan ng Local AI ang mga autonomous agent na magsagawa ng mga kumplikadong gawain sa sarili mong hardware habang pinapanatili ang privacy ng data.
  • Ang mga stack tulad ng NVIDIA NemoClaw ay nagsasama ng mga open model, sandboxing, at granular tool control para sa ligtas na pag-deploy.
  • Ang mga proyektong tulad ng OpenClaw, Jan AI, PocketBot o Ollama+Open WebUI ay nagdadala ng lokal na automation sa mga PC at mobile nang walang bayad.
  • Ang mga screenshot, voice recording, web scraping, at mga nakabalangkas na personal na folder ay nagbibigay-daan sa iyong i-automate ang halos lahat ng iyong digital na buhay.

Lokal na AI at automation sa computer

La automation gamit ang lokal na AI Hindi na ito para lamang sa mga mahilig sa teknolohiya na may mga home server kundi isa na itong tunay na opsyon para sa sinumang nagnanais ng higit na kontrol, privacy, at flexibility. Ngayon, hindi ka na lubos na umaasa sa cloud ng isang malaking kumpanya para magkaroon ng mga ahente na kayang basahin ang iyong screen, igalaw ang iyong mouse, gamitin ang iyong mga file, o magpatakbo ng mga kumplikadong workflow sa background.

Sumabog ang sitwasyon: mula mga full stack tulad ng NemoClaw ng NVIDIA Mula sa mga autonomous agent na tumatakbo sa sarili mong hardware hanggang sa mga mobile app tulad ng PocketBot na nagko-convert ng natural na wika sa mga automation ng telepono, at kabilang ang mga open platform tulad ng OpenClaw, mga assistant tulad ng Jan AI, at mga praktikal na gabay para sa pag-set up ng sarili mong "homemade ChatGPT" gamit ang Ollama at Open WebUI, pareho ang layunin: bumuo ng isang ecosystem kung saan ang AI ay naninirahan sa iyong computer, nakikipag-ugnayan sa iyong mga programa, at ino-automate ang iyong mga pang-araw-araw na gawain nang hindi inaalis ang iyong data sa iyong system.

Ano ang local AI automation at bakit ito mahalaga?

Kapag makipag-usap namin tungkol sa Lokal na AI para sa automationTinutukoy namin ang mga modelo at ahente na tumatakbo sa iyong sariling device (PC, server, DGX, mobile) nang hindi nagpapadala ng sensitibong data sa mga panlabas na server. Ang modelo ay gumagawa ng mga desisyon, nagpapatupad ng code, nagbabasa ng mga file, tumatawag ng mga API, at nagko-coordinate ng mga tool, ngunit lahat ng bagay ay nangyayari sa loob ng iyong kontroladong kapaligiran.

Ang ebolusyon ay naging dramatiko: mula sa mga simpleng chatbot na sumasagot lamang sa mga tanong ay nagpatuloy na tayo sa Mga ahente ng AI na may kakayahang magsagawa ng mga task chainupang isaayos ang maraming hakbang, sumangguni sa iba't ibang mapagkukunan ng datos, at gumawa ng mga desisyong nagsasarili. Lubos nitong binago ang paraan ng ating pag-unawa sa automation: ang modelo ay hindi na lamang "ang sumasagot," ito ay "ang kumikilos."

Ang pagbabagong ito ay may isang malinaw na bunga: Ang mas maraming awtonomiya ay nagpapahiwatig ng mas maraming panganibKung bibigyan mo ang isang ahente ng access sa file system, iyong mga kredensyal, iyong browser, o iyong mga tool sa pag-develop, kailangan mo ng isang matibay na disenyo ng seguridad. Dito mahalaga ang mga lokal na pamamaraan, dahil maaari mong paghigpitan ang mga pahintulot, ihiwalay ang mga proseso, at masusing subaybayan kung ano ang ginagawa ng modelo sa anumang oras.

Bilang karagdagan, mga bukas na modelo na may mga libreng lisensya tulad ng Apache-2.0 o MIT (Tulad ng maraming solusyon ng Falcon, Bark, Jan, atbp.), pinapayagan ka nitong bumuo ng mga solusyon nang hindi nakatali sa mga kontrata o mga hindi malinaw na patakaran sa paggamit. Maaari mong i-audit ang code, ayusin ang modelo, maglapat ng fine-tuning, at i-integrate pa ito sa mga partikular na hardware tulad ng mga A100 GPU o mga NVIDIA DGX workstation.

Para sa maraming sektor (pangangalaga sa kalusugan, pagbabangko, legal, pampublikong administrasyon), kung saan ang Pagkapribado at ligtas na imbakan Ito ay sagrado, ang kombinasyon ng Lokal na AI + mga autonomous na ahente + mga bukas na modelo Malaki ang nagagawa nito: awtomatiko kang mag-o-automate, pero hindi umaalis sa iyong perimeter ang data.

Mga lokal na AI stack para sa advanced automation: NemoClaw, OpenShell, at OpenClaw

Malakas na pumasok ang NVIDIA sa larong ito NemoClawIto ay isang open-source stack na idinisenyo upang ligtas na mag-deploy ng mga autonomous agent nang lokal at matiyak na palagi silang naka-on. Ito ay dinisenyo upang tumakbo sa mga makapangyarihang makina tulad ng NVIDIA DGX Spark, ngunit ang pilosopiya ay naaangkop sa iba pang mga sertipikadong kapaligiran.

Ang NemoClaw ay gumaganap bilang kapa de orquestación: nag-i-install at nagko-coordinate ng OpenShell (ang security runtime) at OpenClaw (ang multi-channel agent framework), kino-configure ang model inference (sa pamamagitan ng Ollama o NVIDIA NIM) at naglalapat ng mga patakaran sa seguridad mula sa simula, hindi bilang isang last-minute patch.

Sa puso ng salansan ay karaniwang NVIDIA Nemotron 3 Super 120BIsang modelo na may 120.000 bilyong parameter na na-optimize para sa mga ahente: napakahusay sa pagsunod sa mga kumplikadong tagubilin, paghawak ng mga tool, at multi-step na pangangatwiran. Gayunpaman, para magpatakbo ng isang bagay na ganito kalaki, kailangan mo ng isang seryosong GPU at maraming memorya; humigit-kumulang 87 GB ang nabanggit para sa modelo pa lamang.

Karaniwang inihahain ang hinuha kasama ng Ollama bilang isang lokal na runtimena naglalantad ng isang REST API sa mismong makina. Nakikipag-ugnayan ang NemoClaw sa API na ito upang magpadala ng mga prompt, tumanggap ng mga tugon, at mag-coordinate ng mga tool call gamit ang tool-calling pattern.

Ang sangkap Mahalaga ang OpenShell sa aspeto ng seguridadIpinapatupad nito ang sandboxing, kinokontrol ang mga kredensyal, kumikilos bilang isang network proxy, at inilalapat ang prinsipyo ng least privilege. Sinusubaybayan nito ang mga koneksyon na sinusubukan ng ahente at pinapayagan kang aprubahan o harangan ang mga endpoint mula sa isang interface na parang TUI. Sa ganitong paraan, kung susubukan ng modelo na mag-access ng isang bagong serbisyo, walang mangyayari nang walang iyong pag-apruba.

Sa loob ng sandbox ay nabubuhay OpenClaw, ang layer ng ahente na may maraming channelPinangangasiwaan nito ang komunikasyon sa mga platform tulad ng Telegram, Slack, at Discord, pinamamahalaan ang memorya ng ahente, nagkokonekta ng mga tool (script, API, browser), at pinapanatili ang pag-uusap nang pangmatagalan. Kung gusto mo ng isang laging naka-on na assistant, naa-access sa pamamagitan ng pagmemensahe, at may persistent memory, ito ang component na nagbibigay-daan para maging posible ito.

Hakbang-hakbang na seguridad, sandboxing, at lokal na pag-deploy

Isa sa mga magagandang kalakasan ng stack na ito ay Ang kaligtasan ay isinasaalang-alang mula sa yugto ng disenyohindi na idadagdag mamaya. Ang karaniwang pagkakamali sa mga proyekto ng ahente ay ang pagbuo muna ng lahat ng mga functionality at pagkatapos ay subukang "protektahan" ang naitayo na, na lumilikha ng mga butas sa lahat ng dako.

  Pagsusuri ng log: isang kumpletong gabay para sa IT, seguridad, at SEO

Ang sentral na mekanismo ay ang sandboxing ng pagpapatupadAng lahat ng code na gustong isagawa ng ahente ay tumatakbo sa loob ng isang nakahiwalay na kapaligiran: wala itong direktang access sa file system ng host, hindi maaaring gumawa ng mga arbitraryong tawag sa network, at hindi maaaring magpataas ng mga pribilehiyo nang lampas sa tinukoy sa configuration.

Malaki ang nababawasan nito sa epekto ng agarang pag-atake ng iniksyon o mga malisyosong tagubilin. Kung magpasya ang modelo na gumawa ng isang bagay na hindi pangkaraniwan, ang pinsala ay mananatiling nakakulong sa loob ng sandbox. Gayunpaman, kinikilala mismo ng NVIDIA na walang sandbox na perpekto, kaya inirerekomenda nila na palaging subukan ang mga bagong tool sa mga nakahiwalay na sistema.

Bukod pa rito, ipinapatupad ng NemoClaw detalyadong kontrol ng mga tool at patakaran sa real timeBilang default, limitado lamang ang bilang ng mga network endpoint na maaaring kontakin ng ahente. Kapag sumubok ito ng isang bagong bagay, hinaharangan ito ng OpenShell, at makikita mo nang eksakto kung ano ang sinusubukan nitong gawin (host, port, process). Pagkatapos ay maaari mo itong aprubahan para sa session na iyon o magdagdag ng permanenteng patakaran sa host.

Ang daloy ng pag-deploy sa isang DGX Spark ay karaniwang sumusunod sa mga hakbang na ito: i-configure Ubuntu 24.04 LTS na may mga driver ng NVIDIA kasunod ng isang gabay sa pag-assemble ng computerI-install ang Docker 28.xo o mas mataas pa na may GPU runtime, i-install ang Ollama at i-download ang Nemotron 3 Super 120B model, at panghuli, ilunsad ang NemoClaw installation gamit ang isang command na magti-trigger ng configuration wizard.

Gagabayan ka ng onboarding na ito pangalan ng sandbox, tagapagbigay ng hinuha, napiling modelo, mga preset ng seguridad At, kung gusto mo, ang integrasyon ng Telegram. Ang aktibong oras ng pag-setup ay tinatayang nasa 20-30 minuto, kasama ang karagdagang 15-30 minuto para ma-download ang template, depende sa bandwidth.

Sa usapin ng pagganap, kailangan nating maging makatotohanan: ang isang tugon na may modelo ng parameter na 120B ay maaaring tumagal sa pagitan ng 30 at 90 segundo sa isang lokal na konteksto. Hindi ito problema sa sarili nito, ngunit kailangan itong isaalang-alang kapag nagdidisenyo ng mga daloy ng paggamit at ang uri ng mga gawain na iyong itinalaga sa ahente.

Malayuang pag-access, web interface, at hardware na idinisenyo para sa lokal na AI

Kapag na-set up na ang lahat, maaari kang makipag-ugnayan sa ahente sa iba't ibang paraan. Ang pinakakaraniwan ay sa pamamagitan ng TelegramGamit ang isang bot na ginawa gamit ang @BotFather, ito ay isang praktikal na pagpipilian: matatag na API, encryption, mga app para sa lahat ng uri ng device, at hindi na kailangang ilantad ang mga port ng iyong server sa labas ng mundo.

Tinatanggap ng bot ang iyong mga mensahe, ipinapasa ang mga ito sa ahente sa DGX, at nagpapadala sa iyo ng tugon. Ang interesante ay, bagama't ang pag-uusap ay dumadaan sa imprastraktura ng Telegram, Ang paghihinuha at pag-access sa sensitibong datos ay nananatiling 100% lokal sa iyong makina.

Bukod pa rito, nag-aalok ang NemoClaw isang pribadong web interface Maa-access sa pamamagitan ng isang tokenized URL na nabuo nang isang beses lamang sa pagtatapos ng onboarding. Mahalagang i-save agad ang URL na ito, dahil hindi na ito muling ipapakita. Para makita ito mula sa ibang makina sa network, dapat mong i-configure ang isang SSH tunnel at port forwarding gamit ang OpenShell.

Isang maliit ngunit mahalagang detalye ay ang URL ay dapat buksan gamit ang 127.0.0.1 sa halip na localhostAng paggamit ng localhost ay maaaring magdulot ng mga error sa unauthorized origin (CORS), na maaaring mag-aksaya ng iyong oras kung hindi mo ito namamalayan.

Para sa pang-araw-araw na operasyon, mayroong ilang mga kapaki-pakinabang na utos ng CLI: magbukas ng shell sa loob ng sandbox, tingnan ang status, sundan ang mga log nang real time, ilista ang mga sandbox, simulan o ihinto ang Telegram bridge, i-activate ang port forwarding, o magpatakbo ng malinis na uninstall script na nag-aalis ng buong stack.

Tulad ng para sa hardware, NVIDIA DGX Spark Malinaw na dinisenyo ito para sa mga ganitong paggamit. Ito ay isang compact system na may mga NVIDIA GPU at high-bandwidth unified memory, mainam para sa pagpapatakbo ng mga medium at large na modelo na may mababang latency nang hindi kinakailangang mag-set up ng isang kumpletong data center.

La pinag-isang memorya Nakakatulong ito lalo na sa isa sa mga klasikong bottleneck: ang paglipat ng data sa pagitan ng CPU at GPU. Sa pamamagitan ng pagbabahagi ng espasyo sa memorya, mas mahusay na naa-access ng modelo ang data, na nagpapahintulot sa mga modelo na may sampu-sampung bilyong parameter na mai-load sa (halos) real time—hindi maiisip hanggang kamakailan lamang sa mga hardware ng mamimili.

Mga sikat na lokal na ahente ng AI: mga halimbawa at mga kaso ng paggamit

Bukod sa NVIDIA ecosystem, mayroon ding ilan Mga ahente ng AI at mga platform na nakatuon sa automation sa iyong sariling koponan na mahalagang malaman. Ang bawat isa ay nagta-target ng iba't ibang uri ng gumagamit at iba't ibang hanay ng mga gawain.

Halimbawa, ang OpenClaw ay naging popular bilang plataporma ng ahente na bukas ang pinagmulan na gumaganap bilang isang personal na katulong. Pinapayagan ka nitong lumikha ng mga pasadyang ahente upang linisin ang iyong inbox, magpadala ng mga mensahe, pamahalaan ang iyong kalendaryo, ayusin ang mga biyahe, o i-automate ang mga paulit-ulit na gawain sa iyong digital na buhay.

Maaaring mai-install sa Windows, macOS at LinuxDinisenyo rin ito upang gumana sa mga modelo ng LLM nang lokal, na nagpapabuti sa privacy at binabawasan ang pag-asa sa cloud. Bukod pa rito, isinasama nito ang mga messaging app tulad ng WhatsApp, Telegram, Discord, Slack, Signal, at Apple Messages, kaya ang iyong ahente ay tumatakbo "sa likod ng mga eksena" ng mga chat na ginagamit mo na.

Sa pamamagitan ng mga plugin, mabibigyan mo ito ng access sa browser, mga social network, mga email client, at iba pang mga application, pati na rin payagan ito makipag-ugnayan sa file system, magpatupad ng mga command at scripto i-automate ang mga karaniwang gawain sa opisina at produktibidad. Ang lahat ng ito ay may malinaw na pokus sa pagpapahintulot sa user na pumili kung aling mga folder, app, at serbisyo ang available sa agent.

  Janus Pro: Ang modelo ng AI ng DeepSeek na nagbabago ng pagbuo ng imahe

Sa mas pangkalahatang ecosystem, ang mga plataporma tulad ng Kabalintunaan ng KompyuterBinabago nito ang Perplexity mula sa isang simpleng conversational search engine tungo sa isang assistant na may kakayahang magsagawa ng mga kumplikadong workflow. Binibigyang-daan ka ng Computer mode na ito na mag-browse sa web, lumikha at mamahala ng mga dokumento, magsulat ng code, magproseso ng data, at makipag-ugnayan sa mga serbisyong tulad ng Gmail, Slack, GitHub, at Notion.

Ang kalakasan nito ay nakasalalay sa paggamit ng mga modelo tulad ng Claude, GPT, Gemini, o ang Sonar mismo ng Perplexity upang pamahalaan ang malalaking dami ng data at hatiin ang mga kumplikadong gawain sa mga subtask na maaaring isagawa nang sunud-sunod o parallel. Bagama't hindi palaging ganap na lokal, ang pattern ng ahente at integrasyon sa mga tool ay halos kapareho ng sa mga ahente na tumatakbo sa iyong makina.

Sa purong open source at lokal na larangan, Jan AI Ito ay inihaharap bilang isang pamalit sa ChatGPT na maaaring i-install sa Windows, Mac, at Linux. Pinapayagan ka nitong gumamit ng mga lokal na modelo tulad ng Llama (Meta) o Gemma (Google), o kumonekta sa mga online na modelo tulad ng ChatGPT, Claude, Gemini, Mistral, Qwen, o DeepSeek kung interesado ka sa isang mix.

Gumagana ang Jan AI bilang klasikong katulong sa pakikipag-usap (magtanong, magbalangkas, magbuod, magsalin, magsulat muli, magpaliwanag) bilang isang ahente na may kakayahang magproseso ng mga file at dokumento, magsagawa ng mga utos, at bumuo ng code sa iba't ibang wika. Bukod pa rito, ang pokus nito sa pagpapasadya ay ginagawang madali ang paglikha ng sarili mong ahente na may mga partikular na tagubilin at lumipat sa pagitan ng iba't ibang "profile" depende sa iyong ginagawa.

Mga ahente sa device: PocketBot at mobile automation

Ang konsepto ng Hindi nananatili ang lokal na AI sa PCMalaki rin ang epekto nito sa mga mobile phone, kung saan parami nang parami ang mga proyektong pumipili ng maliliit ngunit espesyalisadong mga modelo para i-automate ang telepono nang hindi dumadaan sa cloud.

Isang malinaw na halimbawa ay ang PocketBot, isang ahente na direktang tumatakbo sa iPhone gamit ang flame.cpp sa MetalAng misyon nito ay gawing mga automation ng telepono ang natural na wika: sa halip na mag-tap sa isang libong menu o shortcut, ilalarawan mo ang gusto mo at ang ahente na ang bahala sa pagsasalin nito sa mga aksyon.

Gumagamit ang PocketBot ng isang quantized na modelo ng 3.000 bilyong mga parameterTumatakbo nang buo nang lokal at hindi nagpapadala ng data sa mga external server. Ang available na memory sa isang iPhone 15 Pro ay karaniwang magagamit ng 3-4 GB bago simulan ng iOS ang pagpatay sa mga proseso, kaya mahalaga ang laki at quantization ng modelo.

Isa sa mga hamong binanggit ng mga tagalikha nito ay ang paghahanap Maaasahang maliliit na modelo para sa tool-calling at mga nakabalangkas na output sa JSON. Halimbawa, gamit ang Qwen3, nakakaranas sila ng mga problema tulad ng mga ginawang pangalan ng parameter, maling JSON (mga nawawalang bracket) at hindi pare-parehong pagsunod sa schema, na pumipilit sa pagpapatupad ng self-correction at muling subukan ang mga layer.

Marami ring debate tungkol sa pinakamainam na punto ng kwantisasyon Para makamit ang pinakamahusay na ratio ng kalidad/memory, isaalang-alang ang mga opsyon tulad ng q4_K_M o q5_K_S depende sa henerasyon ng chip at magagamit na memorya. Ang bawat mas kaunting bit sa quantization ay nangangahulugan ng mas madaling pamahalaang mga modelo, ngunit maaari itong negatibong makaapekto sa pangangatwiran at katumpakan sa mga tool call.

Ang isa pang aspeto ay ang pagsasaayos ng mga parametro ng sampling depende sa gawain. Kasama sa mga karaniwang konpigurasyon ang temperaturang 0,7, top_p 0,8, top_k 20 at repeat_penalty 1,1, ngunit may interes sa paghihiwalay ng mga estratehiya sa pagbuo para sa malayang pag-uusap kumpara sa tool-calling, kung saan mas mahalaga ang determinismo at mas kaunting pagkamalikhain.

Sa wakas, sa cellphone pamamahala ng konteksto Ito ay lalong maselan: ang system prompt ay karaniwang naka-cache sa KV cache upang maiwasan ang muling pagproseso nito, at ginagamit ang mga sliding window upang maiwasan ang paglampas sa kapasidad; kaya naman mahalagang malaman kung paano i-save at ayusin ang iyong mga prompt.

Higit pa riyan, may puwang para sa mga unti-unting panlilinlang sa pagbubuod, pumipiling memorya, o mga hybrid na pamamaraan na pinagsasama ang naka-compress na kasaysayan at agarang konteksto.

Mag-set up ng sarili mong "lokal na ChatGPT" gamit ang Ollama at Open WebUI

Para sa mga hindi nangangailangan ng stack na kasing kumplikado ng NemoClaw, ngunit gusto isang katulong na uri ng ChatGPT na tumatakbo sa iyong computerIsang napaka-praktikal na pamamaraan batay sa Ollama at Open WebUI ang naging popular.

Ang ideya ay simple: Ollama Ito ang responsable sa pag-download at paghahatid ng mga modelo (Llama, Gemma, Qwen, atbp.) sa iyong makina sa pamamagitan ng isang lokal na API, at ang Open WebUI ay nag-aalok ng web interface na halos kapareho ng ChatGPT ngunit ganap na tumatakbo sa iyong makina. Lahat ng trapiko sa pagitan ng UI at ng modelo ay dumadaan sa localhost.

Isang napakasimpleng sunud-sunod na gabay ang nagdedetalye kung paano, kasama ang ilang 15 utos sa terminalMaaari mong paganahin ang setup na ito sa loob ng wala pang isang oras. Kabilang dito ang pag-install ng Python 3.11, pangunahing configuration ng system, pag-install ng Ollama, at pag-deploy ng Open WebUI, kasama ang mga screenshot at mga tip sa pag-troubleshoot.

Ang resulta ay isang kapaligiran kung saan ka nasisiyahan mga subscription na walang bayadGanap na privacy (hindi kailanman umaalis ang data sa iyong computer), mapagkumpitensyang oras ng pagtugon (walang pila sa mga nakabahaging server), at kumpletong kalayaan upang i-customize ang mga espesyal na assistant upang umangkop sa iyong sariling mga pangangailangan.

Bukod pa rito, isinasama ng Open WebUI ang mga advanced na tampok tulad ng Paghahanap sa web, tagasalin ng code, paggawa ng pasadyang modelo Batay sa mga partikular na configuration, inihahanda nito ang mga advanced na kakayahan ng RAG upang bumuo ng mga personal na knowledge base. Ang ideya ay maaari kang magkaroon ng isang sinanay na "co-pilot" na pamilyar sa iyong mga dokumento at workflow nang hindi umaasa sa mga ikatlong partido.

  Seguridad ng SELinux: Kontrolin ang iyong sistema ng Linux hanggang sa milimetro

Pagkatapos ng ilang buwang paggamit, maraming gumagamit ang nag-uulat na ang kombinasyong ito ay ganap na pumalit [sa dating produkto/serbisyo]. ang kanilang mga bayad na subscription sa mga solusyon sa cloudhabang pinapabuti ang integrasyon gamit ang sarili nilang lokal na datos at mga kagamitan. Ang susunod na natural na hakbang ay ang pagkonekta sa "gawa-gawang ChatGPT" na ito sa mga ahente, script, at serbisyo upang maisaayos ang mas kumplikadong mga automation.

I-automate ang iyong digital na buhay: mga praktikal na halimbawa gamit ang lokal na AI

Maganda pakinggan ang lahat ng ito sa teknikal na aspeto, ngunit ano nga ba ang magagawa mo rito sa pang-araw-araw na buhay? mga lokal na ahente na mahusay ang pagsasanayMalawak ang mga posibilidad kung pagsasamahin mo ang mga multimodal na modelo, pag-access sa screen, mga tool, at nakabalangkas na imbakan.

May mga panukalang ginawa para sa awtomatiko ang paggamit ng sarili mong computer kasama ang mga ahente na tumatanggap ng mga screenshot at kumikilos batay sa mga ito. Ang daloy ay magiging ganito: kukuha ang sistema ng screenshot, ipoproseso ito ng ahente gamit ang isang modelo na may kakayahang gumamit ng mga imahe, mauunawaan kung aling application ang bukas, kung anong mga button ang naroroon, kung anong teksto ang lumalabas, at batay sa iyong prompt, magpapasya kung ano ang susunod na gagawin.

Gamit ang ideyang ito, maaari mong, halimbawa, magtayo ng mga espesyalisadong ahente ng pagsasalinKinukuha ng system ang bahagi ng screen na gusto mong isalin, pinalalaki ito sa isang window na "magnifying glass translator", at bumubuo ng halos agarang pagsasalin gamit ang isang maliit na modelo (hal., 4B parameters) na pino-tune para sa pagsasalin, tulad ng isang pino-tune na variant ng PHI.

Isa pang kawili-wiling harapan ay ang Mga visual na modelo na nagpapalit ng mga screenshot sa mga PDFIsipin ang isang tool na, mula sa mga screenshot ng mga presentasyon, dashboard, o dokumento, ay bubuo ng mga PDF na maayos ang format na maaari mong pinuhin o gamitin nang direkta sa iyong mga presentasyon. Sa pamamagitan ng pagsasama ng Python sa Acrobat, maaari mong i-automate ang buong pipeline.

Para magamit ang web nang hindi umaasa sa mga panlabas na serbisyo, mga beteranong teknolohiya tulad ng Malaking tulong pa rin ang BeautifulSoupMaaari kang mag-set up ng isang magaan na scraper na nagko-crawl ng ilang pahina at nagpapanatili lamang ng kinakailangang HTML (halimbawa, pag-extract lamang , p, h1, h2, h3) at ipasa lamang ang na-filter na teksto sa modelo. Binabawasan nito ang ingay, binibigyan ka ng kumpletong kontrol sa nakikita ng AI, at inaalis ang pag-asa sa mga third-party na API. Kung ang ahente ay mayroon ding access sa cursor at mga tool sa pag-edit ng video , binubuksan nito ang pinto para sa pag-automate ng mga gawain sa mga programang tulad ng DaVinci Resolve o Adobe After Effects. Ikukumpara ng ahente ang huling screenshot sa susunod, hihingin kung saan nito kailangang ilagay ang mouse at kung anong aksyon ang gagawin upang makamit ang resultang iyong hiniling. Sa usapin ng audio, maaari mong isama ang isang sistema ng boses sa pagsusuri ng tao : ang ahente ay bubuo ng isang parirala (halimbawa, "Magandang umaga, aking mahal"), bibigyan mo ito ng iskor mula 1 hanggang 10 at magpapasya kung ise-save ito. Maaaring gamitin ang rating na ito upang isaayos ang mga parameter tulad ng temperatura ng henerasyon, o maaari mo itong manu-manong i-regulate mula sa isang nakalaang window. Sa pamamagitan ng pag-save ng mga voiceover sa mga file tulad ng {phrase}-{number}.mp3 o .wav , maaari mong muling gamitin at pagsamahin ang mga boses sa mga susunod na sesyon. Ang mga modelong tulad ng Bark, na lisensyado ng MIT, ay lubos na angkop para sa halos walang katapusang pagpapasadya na ito, na nagdaragdag pa ng mga emosyonal na nuances kapag may katuturan. Para maisaayos ang lahat ng impormasyong ito, mahalagang bigyan ang ahente ng isang nakabalangkas na personal na folder sa iyong makina: user-info/, search-data/, screenshots/, screenshots-for-translate/, voices/, lang/, code-spaces/… Sa halip na i-upload ang iyong code sa GitHub, maaari mong i-save ang mga proyekto nang lokal at piliin kung aling mga repository o folder ang gagamitin ng ahente bilang konteksto sa bawat session. Panghuli, kung gusto mong umangkop ang modelo sa iyo sa loob ng isang tiyak na tagal ng panahon, maaari mong tuklasin ang mga magaan na pamamaraan ng pagpipino tulad ng LoRA o QLoRA . Ang mga pamamaraang ito ay nagbibigay-daan sa iyo upang ayusin ang modelo sa iyong estilo o sa iyong larangan nang hindi kinakailangang sanayin muli ang lahat mula sa simula, bagaman sa mga kapaligiran kung saan ang purong produktibidad ay pinakamahalaga, maaaring hindi sulit na palagi itong aktibo; sa isip ay dapat mong ma-activate o ma-deactivate ang pagpapasadya na iyon. Sa kontekstong ito, nagiging mahalaga rin ang pagpili ng base model: maraming developer ang naghahanap ng mga modelong Apache-2.0 o MIT , kapwa sa maliliit na sukat (2-4B parameters) para sa mga prototype at katamtamang laki ng mga device, at sa mga modelong 30B na sinanay gamit ang high-end hardware (hal., A100 GPUs) para sa malawakang fine-tuning. Tinatayang ang ilang buwan ng seryosong pagtatrabaho sa larangang ito ay maaaring magbunga ng napakakompetitibong mga resulta. Kung titingnan ang buong ecosystem sa kabuuan, ang on-premises AI automation ay lumilipat mula sa isang eksperimento patungo sa isang matibay na imprastraktura , kapwa para sa mga indibidwal na user na sawang-sawa na sa buwanang bayarin at para sa mga kumpanyang hindi kayang kumuha ng sensitibong data off-premises. Desde stacks listos para producción como NemoClaw hasta configuraciones caseras con Ollama y Open WebUI, pasando por agentes de escritorio y móviles como OpenClaw, Jan AI o PocketBot, el denominador común es el mismo: más control, más privacidad y una autonomía de la IA que, por primera vez, puedes gobernar tú.</p> <div class="post-relacionado-wrapper"><a href="https://informatecdigital.com/microsoft-mu-la-nueva-ia-local-que-revoluciona-la-configuracion-en-windows-11/?utm_source=destacado-inside" class="post-relacionado"><picture fetchpriority="high" decoding="async" class="attachment-medium size-medium wp-post-image"> <source type="image/webp" data-lazy-srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg.webp 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg.webp 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg.webp 1200w" sizes="(max-width: 400px) 100vw, 400px"/> <img fetchpriority="high" decoding="async" width="400" height="225" src="data:image/svg+xml,%3Csvg%20xmlns='http://www.w3.org/2000/svg'%20viewBox='0%200%20400%20225'%3E%3C/svg%3E" alt="microsoft mu ia-0" data-lazy-srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg 1200w" data-lazy-sizes="(max-width: 400px) 100vw, 400px" data-lazy-src="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg"/><noscript><img fetchpriority="high" decoding="async" width="400" height="225" src="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg" alt="microsoft mu ia-0" srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg 1200w" sizes="(max-width: 400px) 100vw, 400px"/></noscript> </picture> <div><div>Related article:</div><div class="post-relacionado-title">Microsoft Mu: la nueva IA local que revoluciona la configuración en Windows 11</div></div></a></div> <div id="toc_container" class="no_bullets"><p class="toc_title">Tabla de Contenidos</p><ul class="toc_list"><li><a href="#Que_es_la_automatizacion_con_IA_local_y_por_que_importa">Qué es la automatización con IA local y por qué importa</a></li><li><a href="#Stacks_de_IA_local_para_automatizacion_avanzada_NemoClaw_OpenShell_y_OpenClaw">Stacks de IA local para automatización avanzada: NemoClaw, OpenShell y OpenClaw</a></li><li><a href="#Seguridad_sandboxing_y_despliegue_local_paso_a_paso">Seguridad, sandboxing y despliegue local paso a paso</a></li><li><a href="#Acceso_remoto_interfaz_web_y_hardware_pensado_para_IA_local">Acceso remoto, interfaz web y hardware pensado para IA local</a></li><li><a href="#Agentes_de_IA_locales_populares_ejemplos_y_casos_de_uso">Agentes de IA locales populares: ejemplos y casos de uso</a></li><li><a href="#Agentes_en_el_dispositivo_PocketBot_y_automatizacion_en_el_movil">Agentes en el dispositivo: PocketBot y automatización en el móvil</a></li><li><a href="#Montar_tu_propio_ChatGPT_local_con_Ollama_y_Open_WebUI">Montar tu propio “ChatGPT local” con Ollama y Open WebUI</a></li><li><a href="#Automatizar_tu_vida_digital_ejemplos_practicos_con_IA_local">Automatizar tu vida digital: ejemplos prácticos con IA local</a></li></ul></div> </div> <footer class="entry-meta" aria-label="Meta de entradas"> <span class="cat-links"><span class="gp-icon icon-categories"><svg viewBox="0 0 512 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em"><path d="M0 112c0-26.51 21.49-48 48-48h110.014a48 48 0 0143.592 27.907l12.349 26.791A16 16 0 00228.486 128H464c26.51 0 48 21.49 48 48v224c0 26.51-21.49 48-48 48H48c-26.51 0-48-21.49-48-48V112z" /></svg></span><span class="screen-reader-text">Categorías </span><a href="https://informatecdigital.com/inteligencia-artificial/" rel="category tag">Inteligencia Artificial</a>, <a href="https://informatecdigital.com/seguridad/" rel="category tag">Seguridad</a></span> <nav id="nav-below" class="post-navigation" aria-label="Entradas"> <div class="nav-previous"><span class="gp-icon icon-arrow-left"><svg viewBox="0 0 192 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em" fill-rule="evenodd" clip-rule="evenodd" stroke-linejoin="round" stroke-miterlimit="1.414"><path d="M178.425 138.212c0 2.265-1.133 4.813-2.832 6.512L64.276 256.001l111.317 111.277c1.7 1.7 2.832 4.247 2.832 6.513 0 2.265-1.133 4.813-2.832 6.512L161.43 394.46c-1.7 1.7-4.249 2.832-6.514 2.832-2.266 0-4.816-1.133-6.515-2.832L16.407 262.514c-1.699-1.7-2.832-4.248-2.832-6.513 0-2.265 1.133-4.813 2.832-6.512l131.994-131.947c1.7-1.699 4.249-2.831 6.515-2.831 2.265 0 4.815 1.132 6.514 2.831l14.163 14.157c1.7 1.7 2.832 3.965 2.832 6.513z" fill-rule="nonzero" /></svg></span><span class="prev"><a href="https://informatecdigital.com/personalidad-en-smart-home-del-hogar-conectado-al-hogar-que-te-entiende/" rel="prev">Personalidad en smart home: del hogar conectado al hogar que te entiende</a></span></div> </nav> </footer> </div> </article> </main> </div> <div data-rocket-location-hash="0b9fe17c76c2e58ac880f2c41872dd87" class="widget-area sidebar is-right-sidebar" id="right-sidebar"> <div class="inside-right-sidebar"> </div> </div> </div><!-- #content --> </div><!-- #page --> <div class="no-wpr-lazyrender site-footer"> <footer class="gb-container gb-container-925a2a1e"> <div class="gb-container gb-container-cbee1dca"> <div class="gb-grid-wrapper gb-grid-wrapper-51f71b20"> <div class="gb-grid-column gb-grid-column-4f4cf5cf"><div class="gb-container gb-container-4f4cf5cf"> <h2 class="gb-headline gb-headline-5c3b3482 gb-headline-text">Informática y Tecnología Digital</h2> <p class="gb-headline gb-headline-e29c0825 gb-headline-text">En <strong>InformaTecDigital</strong> nos dedicamos a proporcionarte las noticias más recientes y sugerencias efectivas, para que estés siempre al día y bien informado. Nuestro objetivo es ser tu socio de confianza en este emocionante recorrido tecnológico, haciendo más fácil tu experiencia con cada nuevo descubrimiento.</p> </div></div> <div class="gb-grid-column gb-grid-column-04e24954"><div class="gb-container gb-container-04e24954"> <h2 class="gb-headline gb-headline-3e937023 gb-headline-text">Categorías</h2> <p class="gb-headline gb-headline-3f1b1c14 gb-headline-text"><a href="https://informatecdigital.com/tecnologia/">Tecnología</a></p> <p class="gb-headline gb-headline-6500416f gb-headline-text"><a href="https://informatecdigital.com/inteligencia-artificial/">Inteligencia Artificial</a></p> <p class="gb-headline gb-headline-86bfcc6a gb-headline-text"><a href="https://informatecdigital.com/programacion/">Programación</a></p> <p class="gb-headline gb-headline-f9d791fe gb-headline-text"><a href="https://informatecdigital.com/algoritmos/">Algoritmos</a></p> <p class="gb-headline gb-headline-1d5a060c gb-headline-text"><a href="https://informatecdigital.com/informatica/">Informática</a></p> <p class="gb-headline gb-headline-ebbabf05 gb-headline-text"><a href="https://informatecdigital.com/internet/">Internet</a></p> </div></div> <div class="gb-grid-column gb-grid-column-1d8f8f12"><div class="gb-container gb-container-1d8f8f12"> <h2 class="gb-headline gb-headline-529b3704 gb-headline-text">síguenos</h2> <div class="gb-container gb-container-8d3b0714"> <a class="gb-button gb-button-8a872c76" href="https://x.com/informatecd" target="_blank" rel="noopener noreferrer" aria-label="Follow Us on Twitter"><span class="gb-icon"><svg aria-hidden="true" role="img" height="1em" width="1em" viewBox="0 0 512 512" xmlns="http://www.w3.org/2000/svg"><path fill="currentColor" d="M389.2 48h70.6L305.6 224.2 487 464H345L233.7 318.6 106.5 464H35.8L200.7 275.5 26.8 48H172.4L272.9 180.9 389.2 48zM364.4 421.8h39.1L151.1 88h-42L364.4 421.8z"></path></svg></span></a> </div> </div></div> </div> <div class="gb-container gb-container-68b619a0"> <p class="gb-headline gb-headline-368a465b gb-headline-text">© 2026 InformaTecDigital</p> <div class="gb-container gb-container-26043e29"> <p class="gb-headline gb-headline-fcb53bf6 gb-headline-text"><a href="https://informatecdigital.com/quienes-somos/">Quienes Somos</a></p> <p class="gb-headline gb-headline-e38f9197 gb-headline-text"><a href="https://informatecdigital.com/aviso-legal/" data-type="page" data-id="24">Aviso Legal</a></p> <p class="gb-headline gb-headline-f9af17bf gb-headline-text"><a href="https://informatecdigital.com/formulario-de-contacto/">Contacto</a></p> </div> </div> </div> </footer> <p></p> </div><!-- .site-footer --> <script type="speculationrules"> {"prefetch":[{"source":"document","where":{"and":[{"href_matches":"/*"},{"not":{"href_matches":["/wp-*.php","/wp-admin/*","/wp-content/uploads/*","/wp-content/*","/wp-content/plugins/*","/wp-content/themes/abn-generatepress-adsense/*","/wp-content/themes/generatepress/*","/*\\?(.+)"]}},{"not":{"selector_matches":"a[rel~=\"nofollow\"]"}},{"not":{"selector_matches":".no-prefetch, .no-prefetch a"}}]},"eagerness":"conservative"}]} </script> <script type="text/rocketlazyloadscript" id="generate-a11y"> !function(){"use strict";if("querySelector"in document&&"addEventListener"in window){var e=document.body;e.addEventListener("pointerdown",(function(){e.classList.add("using-mouse")}),{passive:!0}),e.addEventListener("keydown",(function(){e.classList.remove("using-mouse")}),{passive:!0})}}(); </script> <div data-rocket-location-hash="9089b6fff3545f5f3220e195bce56095" class="gp-modal gp-search-modal" id="gp-search" role="dialog" aria-modal="true" aria-label="Buscar"> <div data-rocket-location-hash="e7419566db319650b22985a79bd613d4" class="gp-modal__overlay" tabindex="-1" data-gpmodal-close> <div data-rocket-location-hash="17238aeffc6392939f4952b095835f70" class="gp-modal__container"> <form role="search" method="get" class="search-modal-form" action="https://informatecdigital.com/"> <label for="search-modal-input" class="screen-reader-text">Buscar:</label> <div class="search-modal-fields"> <input id="search-modal-input" type="search" class="search-field" placeholder="Buscar..." value="" name="s" /> <button aria-label="Buscar"><span class="gp-icon icon-search"><svg viewBox="0 0 512 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em"><path fill-rule="evenodd" clip-rule="evenodd" d="M208 48c-88.366 0-160 71.634-160 160s71.634 160 160 160 160-71.634 160-160S296.366 48 208 48zM0 208C0 93.125 93.125 0 208 0s208 93.125 208 208c0 48.741-16.765 93.566-44.843 129.024l133.826 134.018c9.366 9.379 9.355 24.575-.025 33.941-9.379 9.366-24.575 9.355-33.941-.025L337.238 370.987C301.747 399.167 256.839 416 208 416 93.125 416 0 322.875 0 208z" /></svg></span></button> </div> </form> </div> </div> </div> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/plugins/gp-premium/menu-plus/functions/js/sticky.min.js?ver=2.5.5" id="generate-sticky-js" data-rocket-defer defer></script> <script id="toc-front-js-extra"> var tocplus = {"visibility_show":"mostrar","visibility_hide":"ocultar","visibility_hide_by_default":"1","width":"100%"}; //# sourceURL=toc-front-js-extra </script> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/plugins/table-of-contents-plus/front.min.js?ver=2411.1" id="toc-front-js" data-rocket-defer defer></script> <script type="text/rocketlazyloadscript" id="generate-menu-js-before"> var generatepressMenu = {"toggleOpenedSubMenus":true,"openSubMenuLabel":"Abrir el submen\u00fa","closeSubMenuLabel":"Cerrar el submen\u00fa"}; //# sourceURL=generate-menu-js-before </script> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/themes/generatepress/assets/js/menu.min.js?ver=3.6.1" id="generate-menu-js" data-rocket-defer defer></script> <script type="text/rocketlazyloadscript" data-minify="1" data-rocket-src="https://informatecdigital.com/wp-content/cache/min/1/wp-content/themes/generatepress/assets/dist/modal.js?ver=1777299219" id="generate-modal-js" data-rocket-defer defer></script> <script>window.lazyLoadOptions=[{elements_selector:"img[data-lazy-src],.rocket-lazyload",data_src:"lazy-src",data_srcset:"lazy-srcset",data_sizes:"lazy-sizes",class_loading:"lazyloading",class_loaded:"lazyloaded",threshold:300,callback_loaded:function(element){if(element.tagName==="IFRAME"&&element.dataset.rocketLazyload=="fitvidscompatible"){if(element.classList.contains("lazyloaded")){if(typeof window.jQuery!="undefined"){if(jQuery.fn.fitVids){jQuery(element).parent().fitVids()}}}}}},{elements_selector:".rocket-lazyload",data_src:"lazy-src",data_srcset:"lazy-srcset",data_sizes:"lazy-sizes",class_loading:"lazyloading",class_loaded:"lazyloaded",threshold:300,}];window.addEventListener('LazyLoad::Initialized',function(e){var lazyLoadInstance=e.detail.instance;if(window.MutationObserver){var observer=new MutationObserver(function(mutations){var image_count=0;var iframe_count=0;var rocketlazy_count=0;mutations.forEach(function(mutation){for(var i=0;i<mutation.addedNodes.length;i++){if(typeof mutation.addedNodes[i].getElementsByTagName!=='function'){continue} if(typeof mutation.addedNodes[i].getElementsByClassName!=='function'){continue} images=mutation.addedNodes[i].getElementsByTagName('img');is_image=mutation.addedNodes[i].tagName=="IMG";iframes=mutation.addedNodes[i].getElementsByTagName('iframe');is_iframe=mutation.addedNodes[i].tagName=="IFRAME";rocket_lazy=mutation.addedNodes[i].getElementsByClassName('rocket-lazyload');image_count+=images.length;iframe_count+=iframes.length;rocketlazy_count+=rocket_lazy.length;if(is_image){image_count+=1} if(is_iframe){iframe_count+=1}}});if(image_count>0||iframe_count>0||rocketlazy_count>0){lazyLoadInstance.update()}});var b=document.getElementsByTagName("body")[0];var config={childList:!0,subtree:!0};observer.observe(b,config)}},!1)</script><script data-no-minify="1" async src="https://informatecdigital.com/wp-content/plugins/wp-rocket/assets/js/lazyload/17.8.3/lazyload.min.js"></script><script type="text/rocketlazyloadscript"> /** * Des-Re-Valorizador * Código para hackear valoraciones * Quita el contenido de la columna Valoración de la tabla generada * por el plugin AAWP y asigna una valoración aleatoria entre 4, 4.5 y 5 estrellas. * */ let colRatings = document.querySelectorAll( 'td.aawp-table__td-rating' ); colRatings.forEach( col => col.innerHTML = addRating() ); let colRatings2 = document.querySelectorAll( 'span.aawp-product__no-rating' ); colRatings2.forEach( col => col.innerHTML = addRating() ); function addRating() { const ratings = [ 80, 90, 100 ]; const randomRating = ratings[ Math.floor( Math.random() * ratings.length ) ]; return '<span class="aawp-star-rating aawp-star-rating--small aawp-star-rating--v1"><span style="width: ' + randomRating + '%;"></span></span>'; } </script> <script>var rocket_beacon_data = {"ajax_url":"https:\/\/informatecdigital.com\/wp-admin\/admin-ajax.php","nonce":"44866e9d8e","url":"https:\/\/informatecdigital.com\/ia-local-y-automatizacion-agentes-seguridad-y-casos-reales","is_mobile":false,"width_threshold":1600,"height_threshold":700,"delay":500,"debug":null,"status":{"atf":true,"lrc":true,"preload_fonts":true,"preconnect_external_domain":true},"elements":"img, video, picture, p, main, div, li, svg, section, header, span","lrc_threshold":1800,"preload_fonts_exclusions":["api.fontshare.com","cdn.fontshare.com"],"processed_extensions":["woff2","woff","ttf"],"external_font_exclusions":[],"preconnect_external_domain_elements":["link","script","iframe"],"preconnect_external_domain_exclusions":["informatecdigital.com","com","hreflang","static.cloudflareinsights.com","rel=\"profile\"","rel=\"preconnect\"","rel=\"dns-prefetch\"","rel=\"icon\""]}</script><script data-name="wpr-wpr-beacon" src='https://informatecdigital.com/wp-content/plugins/wp-rocket/assets/js/wpr-beacon.min.js' async></script></body> </html> <!-- This website is like a Rocket, isn't it? Pagganap na-optimize ng WP Rocket. Matuto nang higit pa: https://wp-rocket.me -->