Vietinis dirbtinis intelektas ir automatizavimas: agentai, saugumas ir realaus pasaulio atvejai

Paskutiniai pakeitimai: gegužės 17 d. 2026 m.
  • Vietinis dirbtinis intelektas leidžia autonominiams agentams atlikti sudėtingas užduotis jūsų aparatinėje įrangoje, išsaugant duomenų privatumą.
  • Tokie rinkiniai kaip „NVIDIA NemoClaw“ integruoja atvirus modelius, smėlio dėžės apdorojimą ir granuliuotą įrankių valdymą, kad būtų užtikrintas saugus diegimas.
  • Tokie projektai kaip „OpenClaw“, „Jan AI“, „PocketBot“ ar „Ollama+Open WebUI“ nemokamai teikia vietinę automatizaciją asmeniniuose kompiuteriuose ir mobiliuosiuose įrenginiuose.
  • Ekrano kopijos, balso įrašai, žiniatinklio duomenų iškarpos ir struktūrizuoti asmeniniai aplankai leidžia automatizuoti didelę dalį jūsų skaitmeninio gyvenimo.

Vietinis dirbtinis intelektas ir automatizavimas kompiuteryje

La automatizavimas naudojant vietinį dirbtinį intelektą Tai nebe tik technologijų entuziastų, turinčių namų serverius, pasirinkimas, o reali galimybė visiems, norintiems daugiau kontrolės, privatumo ir lankstumo. Šiandien nebereikia visiškai priklausyti nuo didelės įmonės debesijos, kad agentai galėtų skaityti jūsų ekraną, judinti pelę, dirbti su jūsų failais ar vykdyti sudėtingas darbo eigas fone.

Padėtis sprogo: nuo pilni rinkiniai, tokie kaip NVIDIA „NemoClaw“ Nuo autonominių agentų, veikiančių jūsų pačių aparatinėje įrangoje, iki mobiliųjų programėlių, tokių kaip „PocketBot“, kurios natūralią kalbą konvertuoja į telefono automatizavimą, įskaitant atviras platformas, tokias kaip „OpenClaw“, asistentus, tokius kaip „Jan AI“, ir praktinius vadovus, kaip nustatyti savo „naminį ChatGPT“ naudojant „Ollama“ ir „Open WebUI“, tikslas yra tas pats: sukurti ekosistemą, kurioje dirbtinis intelektas gyvena jūsų kompiuteryje, sąveikauja su jūsų programomis ir automatizuoja jūsų kasdienes užduotis neišimdamas jūsų duomenų iš sistemos.

Kas yra vietinė dirbtinio intelekto automatizacija ir kodėl ji svarbi?

Kai mes kalbame apie Vietinis dirbtinis intelektas automatizavimuiKalbame apie modelius ir agentus, kurie veikia jūsų įrenginyje (asmeniniame kompiuteryje, serveryje, DGX, mobiliajame telefone) nesiunčiant jautrių duomenų į išorinius serverius. Modelis priima sprendimus, vykdo kodą, skaito failus, iškviečia API ir koordinuoja įrankius, tačiau viskas vyksta jūsų kontroliuojamoje aplinkoje.

Evoliucija buvo dramatiška: nuo paprastų pokalbių robotų, kurie atsakinėjo tik į klausimus, perėjome prie Dirbtinio intelekto agentai, galintys vykdyti užduočių grandinesorganizuoti kelis veiksmus, konsultuotis su skirtingais duomenų šaltiniais ir priimti autonominius sprendimus. Tai visiškai pakeitė mūsų supratimą apie automatizavimą: modelis nebėra tik „tas, kuris atsako“, jis yra „tas, kuris veikia“.

Šis pakeitimas turi vieną akivaizdžią pasekmę: Didesnė autonomija reiškia didesnę rizikąJei suteikiate agentui prieigą prie failų sistemos, savo kredencialų, naršyklės ar kūrimo įrankių, jums reikia patikimo saugumo dizaino. Čia praverčia vietiniai metodai, nes galite apriboti teises, izoliuoti procesus ir atidžiai stebėti, ką modelis veikia bet kuriuo metu.

Papildomai, atviri modeliai su nemokamomis licencijomis, tokiomis kaip „Apache-2.0“ arba MIT (Kaip ir daugelis „Falcon“, „Bark“, „Jan“ ir kt.) sprendimų, jie leidžia kurti sprendimus neprisirišant prie sutarčių ar neskaidrių naudojimo politikų. Galite tikrinti kodą, koreguoti modelį, taikyti tikslius derinimus ir netgi integruoti jį su konkrečia aparatine įranga, pvz., A100 GPU arba NVIDIA DGX darbo stotyse.

Daugelyje sektorių (sveikatos priežiūros, bankininkystės, teisės, viešojo administravimo), kur Privatumas ir saugus saugojimas Tai šventa, derinys Vietinis dirbtinis intelektas + autonominiai agentai + atviri modeliai Tai keičia situaciją: jūs automatizuojate, bet duomenys nepalieka jūsų ribų.

Vietiniai dirbtinio intelekto paketai pažangiai automatizacijai: „NemoClaw“, „OpenShell“ ir „OpenClaw“

NVIDIA į šį žaidimą įsitraukė tvirtai su NemoClawTai atvirojo kodo paketas, skirtas saugiai diegti autonominius agentus vietoje ir užtikrinti, kad jie visada būtų įjungti. Jis sukurtas veikti galinguose kompiuteriuose, tokiuose kaip „NVIDIA DGX Spark“, tačiau ši filosofija taikoma ir kitoms sertifikuotoms aplinkoms.

NemoClaw veikia kaip orkestravimo pajėgumas: įdiegia ir koordinuoja „OpenShell“ (saugos vykdymo aplinką) ir „OpenClaw“ (daugiakanalio agento sistemą), konfigūruoja modelio išvadas (per „Ollama“ arba „NVIDIA NIM“) ir taiko saugumo politikas nuo pat pradžių, o ne kaip paskutinės minutės pataisą.

Krūvos centre paprastai yra NVIDIA Nemotron 3 Super 120BModelis su 120.000 milijardų parametrų, optimizuotas agentams: labai gerai seka sudėtingas instrukcijas, valdo įrankius ir samprotauja keliais etapais. Tačiau norint paleisti tokio dydžio sistemą, reikia rimtos grafikos procesoriaus ir daug atminties; vien modeliui minima apie 87 GB.

Išvada paprastai pateikiama kartu su Ollama kaip vietinė vykdymo aplinkakuri pačiame kompiuteryje atveria REST API. „NemoClaw“ bendrauja su šia API, kad siųstų raginimus, gautų atsakymus ir koordinuotų įrankių iškvietimus naudodama įrankių iškvietimo šabloną.

Komponentas „OpenShell“ yra pagrindinis saugumo aspektasJis įgyvendina „smėlio dėžės“ principą, kontroliuoja prisijungimo duomenis, veikia kaip tinklo tarpinis serveris ir taiko mažiausių privilegijų principą. Jis stebi agento bandomus prisijungti ryšius ir leidžia patvirtinti arba blokuoti galinius taškus iš TUI tipo sąsajos. Tokiu būdu, jei modelis bandys prisijungti prie naujos paslaugos, be jūsų patvirtinimo niekas neįvyks.

Smėlio dėžės viduje gyvena „OpenClaw“ – daugiakanalė agento sritisJis tvarko bendravimą su tokiomis platformomis kaip „Telegram“, „Slack“ ir „Discord“, valdo agento atmintį, jungia įrankius (scenarijus, API, naršykles) ir palaiko pokalbį ilgą laiką. Jei norite visada įjungto asistento, pasiekiamo per žinutes ir turinčio nuolatinę atmintį, šis komponentas tai leidžia.

Saugumas, smėlio dėžės aplinka ir vietinis diegimas žingsnis po žingsnio

Vienas didžiausių šio krūvos privalumų yra tas, kad Saugumas vertinamas nuo pat projektavimo etaponepridėta vėliau. Tipinė agentų projektų klaida yra pirmiausia sukurti visas funkcijas, o tada bandyti „apsaugoti“ tai, kas jau sukurta, sukuriant skyles visur.

  Žurnalų analizė: išsamus IT, saugumo ir SEO vadovas

Centrinis mechanizmas yra vykdymo smėlio dėžėVisas kodas, kurį agentas nori vykdyti, vykdomas izoliuotoje aplinkoje: jis neturi tiesioginės prieigos prie pagrindinio kompiuterio failų sistemos, negali atlikti savavališkų tinklo skambučių ir negali suteikti daugiau privilegijų, nei apibrėžta konfigūracijoje.

Tai labai sušvelnina poveikį greiti injekcijų atakos arba kenkėjiškų nurodymų. Jei modelis nusprendžia padaryti ką nors neįprasto, žala lieka tik smėlio dėžėje. Nepaisant to, pati NVIDIA pripažįsta, kad nėra tobulos smėlio dėžės, todėl rekomenduoja visada išbandyti naujus įrankius izoliuotose sistemose.

Be to, „NemoClaw“ įrankiai detali įrankių ir politikų kontrolė realiuoju laikuPagal numatytuosius nustatymus agentas gali bendrauti tik su ribotu skaičiumi tinklo galinių taškų. Kai jis bando atlikti ką nors naujo, „OpenShell“ jį blokuoja ir jūs galite tiksliai matyti, ką jis bando daryti (pagrindinis kompiuteris, prievadas, procesas). Tada galite jį patvirtinti tam seansui arba pridėti nuolatinę politiką pagrindiniame kompiuteryje.

„DGX Spark“ diegimo procesas paprastai atliekamas šiais veiksmais: konfigūravimas Ubuntu 24.04 LTS su NVIDIA tvarkyklėmis po kompiuterio surinkimo vadovasĮdiekite „Docker 28.xo“ arba naujesnę versiją su GPU vykdymo aplinka, įdiekite „Ollama“ ir atsisiųskite „Nemotron 3 Super 120B“ modelį, tada paleiskite „NemoClaw“ diegimą viena komanda, kuri aktyvuoja konfigūravimo vedlį.

Šis įvadinis vadovas padės jums smėlio dėžės pavadinimas, išvados teikėjas, pasirinktas modelis, saugos išankstiniai nustatymai Ir, jei norite, „Telegram“ integracija. Aktyvus nustatymo laikas yra apie 20–30 minučių, plius dar 15–30 minučių šablono atsisiuntimui, priklausomai nuo pralaidumo.

Kalbant apie našumą, turime būti realistai: atsakas su 120B parametrų modeliu gali užtrukti nuo 30 ir 90 sekundžių vietiniame kontekste. Tai savaime nėra problema, tačiau į tai reikia atsižvelgti kuriant naudojimo srautus ir agentui priskiriamų užduočių tipą.

Nuotolinė prieiga, žiniatinklio sąsaja ir aparatinė įranga, sukurta vietiniam dirbtiniam intelektui

Kai viskas bus paruošta, galėsite bendrauti su agentu keliais būdais. Dažniausiai tai yra per „Telegram“Naudojant robotą, sukurtą naudojant @BotFather, tai praktiškas pasirinkimas: patikima API, šifravimas, programėlės visų tipų įrenginiams ir nereikia atskleisti serverio prievadų išoriniam pasauliui.

Robotas gauna jūsų žinutes, persiunčia jas agentui DGX tinkle ir atsiunčia jums atsakymą. Įdomu tai, kad nors pokalbis vyksta per „Telegram“ infrastruktūrą, Išvados ir prieiga prie jautrių duomenų išlieka 100 % vietinės savo mašinoje.

Be to, „NemoClaw“ siūlo privati ​​žiniatinklio sąsaja Pasiekiama per tokenizuotą URL, sugeneruotą tik vieną kartą diegimo pabaigoje. Labai svarbu šį URL nedelsiant išsaugoti, nes jis nebus rodomas dar kartą. Norėdami jį peržiūrėti iš kito tinklo kompiuterio, turite sukonfigūruoti SSH tunelį ir prievadų peradresavimą naudodami „OpenShell“.

Viena maža, bet svarbi detalė yra ta, kad URL turi būti atidarytas su 127.0.0.1 vietoj localhostNaudojant „localhost“, gali kilti neautorizuotos kilmės (CORS) klaidų, kurios, jei apie tai nežinote, gali sugaišti jūsų laiką.

Kasdienėms operacijoms yra keletas Naudingos CLI komandos: atidarykite apvalkalą smėlio dėžėje, peržiūrėkite būseną, realiuoju laiku sekite žurnalus, sudarykite smėlio dėžių sąrašą, paleiskite arba sustabdykite „Telegram“ tiltą, įjunkite prievadų peradresavimą arba paleiskite švarų pašalinimo scenarijų, kuris pašalina visą steko.

Kalbant apie aparatūrą, NVIDIA DGX Spark Jis aiškiai sukurtas tokiems naudojimo atvejams. Tai kompaktiška sistema su NVIDIA GPU ir didelio pralaidumo vieninga atmintimi, idealiai tinkanti vidutinio ir didelio dydžio modeliams su mažu delsos laiku, nereikalaujant įrengti viso duomenų centro.

La vieninga atmintis Tai ypač padeda išspręsti vieną iš klasikinių kliūčių: duomenų perkėlimą tarp procesoriaus ir grafikos procesoriaus. Bendrindamas atminties erdvę, modelis daug efektyviau pasiekia duomenis, leisdamas modelius su dešimtimis milijardų parametrų įkelti (beveik) realiuoju laiku – tai iki šiol buvo neįsivaizduojama vartotojų įrangoje.

Populiarūs vietiniai dirbtinio intelekto agentai: pavyzdžiai ir naudojimo atvejai

Be NVIDIA ekosistemos, yra nemažai Dirbtinio intelekto agentai ir automatizavimo platformos jūsų komandoje kuriuos verta žinoti. Kiekvienas iš jų skirtas skirtingo tipo vartotojams ir skirtingoms užduotims.

Pavyzdžiui, „OpenClaw“ išpopuliarėjo kaip atvirojo kodo agentų platforma kuris veikia kaip asmeninis asistentas. Jis leidžia jums kurti pasirinktinius agentus, kurie išvalys jūsų pašto dėžutę, siųs laiškus, tvarkys kalendorių, tvarkys keliones arba automatizuos pasikartojančias užduotis jūsų skaitmeniniame gyvenime.

Galima įdiegti „Windows“, „MacOS“ ir „Linux“Jis taip pat sukurtas veikti lokaliai su LLM modeliais, o tai pagerina privatumą ir sumažina priklausomybę nuo debesies. Be to, jis integruojamas su pranešimų siuntimo programėlėmis, tokiomis kaip „WhatsApp“, „Telegram“, „Discord“, „Slack“, „Signal“ ir „Apple Messages“, todėl jūsų agentas veikia „užkulisiuose“ jau naudojamuose pokalbiuose.

Naudodami papildinius galite suteikti jam prieigą prie naršyklės, socialinių tinklų, el. pašto klientų ir kitų programų, taip pat leisti jam sąveikauti su failų sistema, vykdyti komandas ir scenarijusarba automatizuoti įprastas biuro ir produktyvumo užduotis. Visa tai aiškiai sutelkiant dėmesį į tai, kad vartotojas galėtų pasirinkti, kurie aplankai, programos ir paslaugos yra prieinamos agentui.

  Janus Pro: „DeepSeek“ dirbtinio intelekto modelis, sukeliantis revoliuciją vaizdo kūrimui

Bendresnėje ekosistemoje tokios platformos kaip Painiavos kompiuterisTai „Perplexity“ iš paprastos pokalbių paieškos sistemos paverčia asistentu, galinčiu vykdyti sudėtingus darbo eigą. Šis kompiuterio režimas leidžia naršyti internete, kurti ir tvarkyti dokumentus, rašyti kodą, apdoroti duomenis ir koordinuoti veiksmus su tokiomis paslaugomis kaip „Gmail“, „Slack“, „GitHub“ ir „Notion“.

Jo stiprybė slypi tame, kad jis gali panaudoti tokius modelius kaip „Claude“, „GPT“, „Gemini“ ar paties „Perplexity“ sukurtas „Sonar“, kad būtų galima valdyti didelius duomenų kiekius ir suskirstyti sudėtingas užduotis į dalines užduotis, kurias galima vykdyti nuosekliai arba lygiagrečiai. Nors ne visada visiškai lokaliai, agento modelis ir integracija su įrankiais yra labai panašūs į jūsų kompiuteryje veikiančių agentų modelį ir integraciją.

Grynai atvirojo kodo ir vietinėje srityje Janas AI Jis pateikiamas kaip „ChatGPT“ pakaitalas, kurį galima įdiegti „Windows“, „Mac“ ir „Linux“ sistemose. Jis leidžia naudoti vietinius modelius, tokius kaip „Llama“ („Meta“) arba „Gemma“ („Google“), arba prisijungti prie internetinių modelių, tokių kaip „ChatGPT“, „Claude“, „Gemini“, „Mistral“, „Qwen“ arba „DeepSeek“, jei jus domina jų derinys.

Jan AI veikia ir kaip klasikinis pokalbių asistentas (klausti, rengti juodraštį, apibendrinti, versti, perrašyti, paaiškinti) kaip agentą, galintį apdoroti failus ir dokumentus, vykdyti komandas ir generuoti kodą įvairiomis kalbomis. Be to, dėmesys jo pritaikymui leidžia lengvai sukurti savo agentą su konkrečiomis instrukcijomis ir perjungti skirtingus „profilius“, priklausomai nuo to, ką darote.

Įrenginyje esantys agentai: „PocketBot“ ir mobilioji automatizacija

Sąvoka Vietinis dirbtinis intelektas nelieka kompiuteryjeTai taip pat daro didelę įtaką mobiliesiems telefonams, kur vis daugiau projektų renkasi mažus, bet specializuotus modelius, kad automatizuotų telefoną nenaudojant debesijos.

Ryškus pavyzdys yra „PocketBot“ – agentas, veikiantis tiesiogiai „iPhone“ naudojant „flame.cpp“ sistemoje „Metal“Jos misija – natūralią kalbą paversti telefono automatizavimu: užuot naršę po tūkstantį meniu ar sparčiųjų klavišų, jūs aprašote tai, ko norite, o agentas pasirūpina, kad tai būtų paversta veiksmais.

„PocketBot“ naudoja kvantinį modelį 3.000 milijardų parametrųVeikia visiškai lokaliai ir nesiunčiant duomenų į išorinius serverius. „iPhone 15 Pro“ įrenginyje paprastai yra 3–4 GB laisvos atminties, kol „iOS“ nepradeda stabdyti procesų, todėl modelio dydis ir kvantavimas yra labai svarbūs.

Vienas iš iššūkių, kuriuos mini kūrėjai, yra rasti Patikimi maži modeliai įrankių iškvietimui ir struktūrizuotiems rezultatams JSON kalba. Pavyzdžiui, naudodami „Qwen3“, jie susiduria su tokiomis problemomis kaip išgalvoti parametrų pavadinimai, netinkamai suformuotas JSON (trūkstami skliaustai) ir nenuoseklus schemos laikymasis, todėl tenka diegti savitaisymo ir pakartotinio bandymo sluoksnius.

Taip pat daug diskutuojama apie optimalus kvantavimo taškas Norint pasiekti geriausią kokybės ir atminties santykį, apsvarstykite tokias parinktis kaip q4_K_M arba q5_K_S, priklausomai nuo lusto kartos ir turimos atminties. Kiekvienas mažesnis bitas kvantizacijoje reiškia lengviau valdomus modelius, tačiau tai gali neigiamai paveikti įrankių iškvietimų samprotavimus ir tikslumą.

Kitas aspektas yra koregavimas atrankos parametrai priklausomai nuo užduoties. Tipinės konfigūracijos apima temperatūrą 0,7, top_p 0,8, top_k 20 ir repeat_penalty 1,1, tačiau yra įdomu atskirti generavimo strategijas laisvam pokalbiui ir įrankių iškvietimui, kur domina daugiau determinizmo ir mažiau kūrybiškumo.

Galiausiai, mobiliajame telefone konteksto valdymas Tai ypač subtilu: sistemos raginimas paprastai kaupiamas KV talpykloje, kad nebūtų pakartotinai apdorojamas, o stumdomi langai naudojami siekiant neviršyti talpos; todėl naudinga žinoti, kaip tai padaryti. išsaugoti ir tvarkyti savo raginimus.

Be to, yra vietos laipsniško apibendrinimo gudrybėms, selektyviai atminčiai arba hibridinėms schemoms, kurios sujungia suspaustą istoriją ir tiesioginį kontekstą.

Sukurkite savo „vietinį ChatGPT“ su „Ollama“ ir „Open WebUI“

Tiems, kuriems nereikia tokio sudėtingo rinkinio kaip „NemoClaw“, bet nori „ChatGPT“ tipo asistentas, veikiantis jūsų kompiuteryjeIšpopuliarėjo labai praktiškas požiūris, pagrįstas „Ollama“ ir „Open WebUI“.

Idėja paprasta: Ollama Jis yra atsakingas už modelių atsisiuntimą ir pateikimą (pvz., „Llama“, „Gemma“, „Qwen“ ir kt.) jūsų kompiuteryje per vietinę API, o „Open WebUI“ siūlo žiniatinklio sąsają, labai panašią į „ChatGPT“, bet veikiančią tik jūsų kompiuteryje. Visas srautas tarp vartotojo sąsajos ir modelio vyksta per „localhost“.

Labai aiškiame, žingsnis po žingsnio vadove išsamiai aprašoma, kaip, pateikiant keletą patarimų 15 terminalo komandųŠią sąranką galite pradėti naudoti per mažiau nei valandą. Į ją įeina „Python 3.11“ diegimas, pagrindinė sistemos konfigūracija, „Ollama“ diegimas ir „Open WebUI“ diegimas, taip pat ekrano kopijos ir trikčių šalinimo patarimai.

Rezultatas – aplinka, kurioje mėgausitės nulinės prenumeratosVisiškas privatumas (duomenys niekada nepalieka jūsų kompiuterio), konkurencingas reagavimo laikas (nėra bendrų serverių eilių) ir visiška laisvė pritaikyti specializuotus asistentus pagal savo poreikius.

Be to, „Open WebUI“ integruoja pažangias funkcijas, tokias kaip Žiniatinklio paieška, kodo interpretatorius, pasirinktinio modelio kūrimas Remiantis konkrečiomis konfigūracijomis, ji rengia pažangias RAG galimybes asmeninėms žinių bazėms kurti. Idėja yra ta, kad galite turėti apmokytą „bendrąjį pilotą“, susipažinusį su jūsų dokumentais ir darbo eigomis, nepasikliaujant trečiosiomis šalimis.

  SELinux saugumas: valdykite savo Linux sistemą iki milimetro tikslumu

Po kelių mėnesių naudojimo daugelis naudotojų praneša, kad šis derinys visiškai pakeitė [ankstesnį produktą / paslaugą]. jų mokamos debesijos sprendimų prenumeratostuo pačiu gerinant integraciją su jų pačių vietiniais duomenimis ir įrankiais. Kitas natūralus žingsnis – sujungti šį „naminį ChatGPT“ su agentais, scenarijais ir paslaugomis, kad būtų galima koordinuoti sudėtingesnes automatizacijas.

Automatizuokite savo skaitmeninį gyvenimą: praktiniai pavyzdžiai su vietiniu dirbtiniu intelektu

Techniškai visa tai skamba puikiai, bet ką iš tikrųjų su tuo galima nuveikti kasdieniame gyvenime? gerai apmokyti vietiniai agentaiGalimybės yra gana plačios, jei derinate multimodalinius modelius, prieigą prie ekrano, įrankius ir struktūrizuotą saugyklą.

Yra pasiūlymų, skirtų automatizuoti savo kompiuterio naudojimą su agentais, kurie gauna ekrano kopijas ir su jomis reaguoja. Procesas būtų maždaug toks: sistema padaro ekrano kopiją, agentas ją apdoroja naudodamas modelį, galintį dirbti su vaizdais, supranta, kuri programa yra atidaryta, kokie mygtukai yra, koks tekstas rodomas, ir, remdamasis jūsų raginimu, nusprendžia, ką daryti toliau.

Su šia idėja galėtumėte, pavyzdžiui, įsteigti specializuotas vertimo agentūrasSistema fiksuoja ekrano dalį, kurią norite versti, padidina ją „didinamojo stiklo vertėjo“ lange ir beveik akimirksniu sugeneruoja vertimą, naudodama nedidelį modelį (pvz., 4B parametrus), tiksliai suderintą vertimui, kaip tiksliai suderintą PHI variantą.

Kitas įdomus frontas yra tas, Vizualiniai modeliai, kurie ekrano kopijas paverčia PDF failaisĮsivaizduokite įrankį, kuris iš pristatymų ekrano kopijų, ataskaitų suvestinių ar dokumentų generuoja tinkamai suformatuotus PDF failus, kuriuos vėliau galite patobulinti arba naudoti tiesiogiai savo pristatymuose. Integravę „Python“ su „Acrobat“, galėtumėte automatizuoti visą procesą.

Norint dirbti su žiniatinkliu nepasikliaujant išorinėmis paslaugomis, reikalingos senesnės technologijos, pvz. „BeautifulSoup“ vis dar labai naudingosGalite nustatyti lengvą skreperį, kuris nuskaito kelis puslapius ir saugo tik būtiną HTML (pavyzdžiui, išskirdamas tik , p, h1, h2, h3) ir modeliui perduoti tik filtruotą tekstą. Tai sumažina triukšmą, suteikia jums visišką DI matomo vaizdo kontrolę ir pašalina poreikį naudoti trečiųjų šalių API. Jei agentas taip pat turi prieigą prie žymeklio ir vaizdo įrašų redagavimo įrankių , tai atveria duris užduočių automatizavimui tokiose programose kaip „DaVinci Resolve“ ar „Adobe After Effects“. Agentas palygintų paskutinę ekrano kopiją su kita, nustatytų, kur reikia perkelti pelės žymeklį ir kokius veiksmus atlikti norint pasiekti pageidaujamą rezultatą. Kalbant apie garsą, galite integruoti balso sistemą su žmogaus vertinimu : agentas sugeneruoja frazę (pavyzdžiui, „Labas rytas, mano meile“), jūs įvertinate ją nuo 1 iki 10 ir nusprendžiate, ar ją išsaugoti. Šį įvertinimą galima naudoti norint reguliuoti parametrus, tokius kaip generavimo temperatūra, arba galite jį reguliuoti rankiniu būdu iš tam skirto lango. Išsaugodami balso perrašymus tokiuose failuose kaip {phrase}-{number}.mp3 arba .wav , galėsite pakartotinai naudoti ir perjungti balsus būsimuose seansuose. Tokie modeliai kaip „Bark“, licencijuoti MIT, labai gerai tinka šiam beveik begaliniam pritaikymui, netgi pridedant emocinių niuansų, kai tai prasminga. Norint sutvarkyti visą šią informaciją, labai svarbu agentui jūsų kompiuteryje sukurti struktūrizuotą asmeninį aplanką : user-info/, search-data/, screenshots/, screenshots-for-translate/, voices/, lang/, code-spaces/… Užuot įkėlę kodą į „GitHub“, galite išsaugoti projektus lokaliai ir pasirinkti, kurias saugyklas ar aplankus agentas naudos kaip kontekstą kiekvieno seanso metu. Galiausiai, jei norite, kad modelis tam tikrą laiką prisitaikytų prie jūsų, galite išbandyti nedidelius tikslinimo metodus, tokius kaip LoRA arba QLoRA . Šie metodai leidžia pritaikyti modelį prie savo stiliaus ar srities, nereikia visko iš naujo mokyti nuo nulio, nors aplinkose, kuriose svarbiausia yra grynas produktyvumas, gali būti neverta jo visada laikyti aktyvaus; idealiu atveju turėtumėte galėti įjungti arba išjungti šį pritaikymą. Šiame kontekste svarbus ir bazinio modelio pasirinkimas: daugelis kūrėjų ieško „Apache-2.0“ arba MIT modelių , tiek mažų (2–4B parametrai) prototipams ir kukliems įrenginiams, tiek 30B modelių, apmokytų naudojant aukščiausios klasės aparatinę įrangą (pvz., A100 GPU), skirtų didelio masto tiksliam derinimui. Manoma, kad keli mėnesiai rimto darbo šioje srityje gali duoti labai konkurencingų rezultatų. Žvelgiant į visą ekosistemą kaip visumą, dirbtinio intelekto automatizavimas vietoje iš eksperimento virsta tvirta infrastruktūra tiek individualiems vartotojams, kuriems atsibodo mėnesiniai mokesčiai, tiek įmonėms, kurios negali sau leisti perkelti jautrių duomenų iš įmonės patalpų. Desde stacks listos para producción como NemoClaw hasta configuraciones caseras con Ollama y Open WebUI, pasando por agentes de escritorio y móviles como OpenClaw, Jan AI o PocketBot, el denominador común es el mismo: más control, más privacidad y una autonomía de la IA que, por primera vez, puedes gobernar tú.</p> <div class="post-relacionado-wrapper"><a href="https://informatecdigital.com/microsoft-mu-la-nueva-ia-local-que-revoluciona-la-configuracion-en-windows-11/?utm_source=destacado-inside" class="post-relacionado"><picture fetchpriority="high" decoding="async" class="attachment-medium size-medium wp-post-image"> <source type="image/webp" data-lazy-srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg.webp 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg.webp 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg.webp 1200w" sizes="(max-width: 400px) 100vw, 400px"/> <img fetchpriority="high" decoding="async" width="400" height="225" src="data:image/svg+xml,%3Csvg%20xmlns='http://www.w3.org/2000/svg'%20viewBox='0%200%20400%20225'%3E%3C/svg%3E" alt="microsoft mu ia-0" data-lazy-srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg 1200w" data-lazy-sizes="(max-width: 400px) 100vw, 400px" data-lazy-src="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg"/><noscript><img fetchpriority="high" decoding="async" width="400" height="225" src="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg" alt="microsoft mu ia-0" srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg 1200w" sizes="(max-width: 400px) 100vw, 400px"/></noscript> </picture> <div><div>Related article:</div><div class="post-relacionado-title">Microsoft Mu: la nueva IA local que revoluciona la configuración en Windows 11</div></div></a></div> <div id="toc_container" class="no_bullets"><p class="toc_title">Tabla de Contenidos</p><ul class="toc_list"><li><a href="#Que_es_la_automatizacion_con_IA_local_y_por_que_importa">Qué es la automatización con IA local y por qué importa</a></li><li><a href="#Stacks_de_IA_local_para_automatizacion_avanzada_NemoClaw_OpenShell_y_OpenClaw">Stacks de IA local para automatización avanzada: NemoClaw, OpenShell y OpenClaw</a></li><li><a href="#Seguridad_sandboxing_y_despliegue_local_paso_a_paso">Seguridad, sandboxing y despliegue local paso a paso</a></li><li><a href="#Acceso_remoto_interfaz_web_y_hardware_pensado_para_IA_local">Acceso remoto, interfaz web y hardware pensado para IA local</a></li><li><a href="#Agentes_de_IA_locales_populares_ejemplos_y_casos_de_uso">Agentes de IA locales populares: ejemplos y casos de uso</a></li><li><a href="#Agentes_en_el_dispositivo_PocketBot_y_automatizacion_en_el_movil">Agentes en el dispositivo: PocketBot y automatización en el móvil</a></li><li><a href="#Montar_tu_propio_ChatGPT_local_con_Ollama_y_Open_WebUI">Montar tu propio “ChatGPT local” con Ollama y Open WebUI</a></li><li><a href="#Automatizar_tu_vida_digital_ejemplos_practicos_con_IA_local">Automatizar tu vida digital: ejemplos prácticos con IA local</a></li></ul></div> </div> <footer class="entry-meta" aria-label="Meta de entradas"> <span class="cat-links"><span class="gp-icon icon-categories"><svg viewBox="0 0 512 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em"><path d="M0 112c0-26.51 21.49-48 48-48h110.014a48 48 0 0143.592 27.907l12.349 26.791A16 16 0 00228.486 128H464c26.51 0 48 21.49 48 48v224c0 26.51-21.49 48-48 48H48c-26.51 0-48-21.49-48-48V112z" /></svg></span><span class="screen-reader-text">Categorías </span><a href="https://informatecdigital.com/inteligencia-artificial/" rel="category tag">Inteligencia Artificial</a>, <a href="https://informatecdigital.com/seguridad/" rel="category tag">Seguridad</a></span> <nav id="nav-below" class="post-navigation" aria-label="Entradas"> <div class="nav-previous"><span class="gp-icon icon-arrow-left"><svg viewBox="0 0 192 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em" fill-rule="evenodd" clip-rule="evenodd" stroke-linejoin="round" stroke-miterlimit="1.414"><path d="M178.425 138.212c0 2.265-1.133 4.813-2.832 6.512L64.276 256.001l111.317 111.277c1.7 1.7 2.832 4.247 2.832 6.513 0 2.265-1.133 4.813-2.832 6.512L161.43 394.46c-1.7 1.7-4.249 2.832-6.514 2.832-2.266 0-4.816-1.133-6.515-2.832L16.407 262.514c-1.699-1.7-2.832-4.248-2.832-6.513 0-2.265 1.133-4.813 2.832-6.512l131.994-131.947c1.7-1.699 4.249-2.831 6.515-2.831 2.265 0 4.815 1.132 6.514 2.831l14.163 14.157c1.7 1.7 2.832 3.965 2.832 6.513z" fill-rule="nonzero" /></svg></span><span class="prev"><a href="https://informatecdigital.com/personalidad-en-smart-home-del-hogar-conectado-al-hogar-que-te-entiende/" rel="prev">Personalidad en smart home: del hogar conectado al hogar que te entiende</a></span></div> </nav> </footer> </div> </article> </main> </div> <div data-rocket-location-hash="0b9fe17c76c2e58ac880f2c41872dd87" class="widget-area sidebar is-right-sidebar" id="right-sidebar"> <div class="inside-right-sidebar"> </div> </div> </div><!-- #content --> </div><!-- #page --> <div class="no-wpr-lazyrender site-footer"> <footer class="gb-container gb-container-925a2a1e"> <div class="gb-container gb-container-cbee1dca"> <div class="gb-grid-wrapper gb-grid-wrapper-51f71b20"> <div class="gb-grid-column gb-grid-column-4f4cf5cf"><div class="gb-container gb-container-4f4cf5cf"> <h2 class="gb-headline gb-headline-5c3b3482 gb-headline-text">Informática y Tecnología Digital</h2> <p class="gb-headline gb-headline-e29c0825 gb-headline-text">En <strong>InformaTecDigital</strong> nos dedicamos a proporcionarte las noticias más recientes y sugerencias efectivas, para que estés siempre al día y bien informado. Nuestro objetivo es ser tu socio de confianza en este emocionante recorrido tecnológico, haciendo más fácil tu experiencia con cada nuevo descubrimiento.</p> </div></div> <div class="gb-grid-column gb-grid-column-04e24954"><div class="gb-container gb-container-04e24954"> <h2 class="gb-headline gb-headline-3e937023 gb-headline-text">Categorías</h2> <p class="gb-headline gb-headline-3f1b1c14 gb-headline-text"><a href="https://informatecdigital.com/tecnologia/">Tecnología</a></p> <p class="gb-headline gb-headline-6500416f gb-headline-text"><a href="https://informatecdigital.com/inteligencia-artificial/">Inteligencia Artificial</a></p> <p class="gb-headline gb-headline-86bfcc6a gb-headline-text"><a href="https://informatecdigital.com/programacion/">Programación</a></p> <p class="gb-headline gb-headline-f9d791fe gb-headline-text"><a href="https://informatecdigital.com/algoritmos/">Algoritmos</a></p> <p class="gb-headline gb-headline-1d5a060c gb-headline-text"><a href="https://informatecdigital.com/informatica/">Informática</a></p> <p class="gb-headline gb-headline-ebbabf05 gb-headline-text"><a href="https://informatecdigital.com/internet/">Internet</a></p> </div></div> <div class="gb-grid-column gb-grid-column-1d8f8f12"><div class="gb-container gb-container-1d8f8f12"> <h2 class="gb-headline gb-headline-529b3704 gb-headline-text">síguenos</h2> <div class="gb-container gb-container-8d3b0714"> <a class="gb-button gb-button-8a872c76" href="https://x.com/informatecd" target="_blank" rel="noopener noreferrer" aria-label="Follow Us on Twitter"><span class="gb-icon"><svg aria-hidden="true" role="img" height="1em" width="1em" viewBox="0 0 512 512" xmlns="http://www.w3.org/2000/svg"><path fill="currentColor" d="M389.2 48h70.6L305.6 224.2 487 464H345L233.7 318.6 106.5 464H35.8L200.7 275.5 26.8 48H172.4L272.9 180.9 389.2 48zM364.4 421.8h39.1L151.1 88h-42L364.4 421.8z"></path></svg></span></a> </div> </div></div> </div> <div class="gb-container gb-container-68b619a0"> <p class="gb-headline gb-headline-368a465b gb-headline-text">© 2026 InformaTecDigital</p> <div class="gb-container gb-container-26043e29"> <p class="gb-headline gb-headline-fcb53bf6 gb-headline-text"><a href="https://informatecdigital.com/quienes-somos/">Quienes Somos</a></p> <p class="gb-headline gb-headline-e38f9197 gb-headline-text"><a href="https://informatecdigital.com/aviso-legal/" data-type="page" data-id="24">Aviso Legal</a></p> <p class="gb-headline gb-headline-f9af17bf gb-headline-text"><a href="https://informatecdigital.com/formulario-de-contacto/">Contacto</a></p> </div> </div> </div> </footer> <p></p> </div><!-- .site-footer --> <script type="speculationrules"> {"prefetch":[{"source":"document","where":{"and":[{"href_matches":"/*"},{"not":{"href_matches":["/wp-*.php","/wp-admin/*","/wp-content/uploads/*","/wp-content/*","/wp-content/plugins/*","/wp-content/themes/abn-generatepress-adsense/*","/wp-content/themes/generatepress/*","/*\\?(.+)"]}},{"not":{"selector_matches":"a[rel~=\"nofollow\"]"}},{"not":{"selector_matches":".no-prefetch, .no-prefetch a"}}]},"eagerness":"conservative"}]} </script> <script type="text/rocketlazyloadscript" id="generate-a11y"> !function(){"use strict";if("querySelector"in document&&"addEventListener"in window){var e=document.body;e.addEventListener("pointerdown",(function(){e.classList.add("using-mouse")}),{passive:!0}),e.addEventListener("keydown",(function(){e.classList.remove("using-mouse")}),{passive:!0})}}(); </script> <div data-rocket-location-hash="9089b6fff3545f5f3220e195bce56095" class="gp-modal gp-search-modal" id="gp-search" role="dialog" aria-modal="true" aria-label="Buscar"> <div data-rocket-location-hash="e7419566db319650b22985a79bd613d4" class="gp-modal__overlay" tabindex="-1" data-gpmodal-close> <div data-rocket-location-hash="17238aeffc6392939f4952b095835f70" class="gp-modal__container"> <form role="search" method="get" class="search-modal-form" action="https://informatecdigital.com/"> <label for="search-modal-input" class="screen-reader-text">Buscar:</label> <div class="search-modal-fields"> <input id="search-modal-input" type="search" class="search-field" placeholder="Buscar..." value="" name="s" /> <button aria-label="Buscar"><span class="gp-icon icon-search"><svg viewBox="0 0 512 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em"><path fill-rule="evenodd" clip-rule="evenodd" d="M208 48c-88.366 0-160 71.634-160 160s71.634 160 160 160 160-71.634 160-160S296.366 48 208 48zM0 208C0 93.125 93.125 0 208 0s208 93.125 208 208c0 48.741-16.765 93.566-44.843 129.024l133.826 134.018c9.366 9.379 9.355 24.575-.025 33.941-9.379 9.366-24.575 9.355-33.941-.025L337.238 370.987C301.747 399.167 256.839 416 208 416 93.125 416 0 322.875 0 208z" /></svg></span></button> </div> </form> </div> </div> </div> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/plugins/gp-premium/menu-plus/functions/js/sticky.min.js?ver=2.5.5" id="generate-sticky-js" data-rocket-defer defer></script> <script id="toc-front-js-extra"> var tocplus = {"visibility_show":"mostrar","visibility_hide":"ocultar","visibility_hide_by_default":"1","width":"100%"}; //# sourceURL=toc-front-js-extra </script> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/plugins/table-of-contents-plus/front.min.js?ver=2411.1" id="toc-front-js" data-rocket-defer defer></script> <script type="text/rocketlazyloadscript" id="generate-menu-js-before"> var generatepressMenu = {"toggleOpenedSubMenus":true,"openSubMenuLabel":"Abrir el submen\u00fa","closeSubMenuLabel":"Cerrar el submen\u00fa"}; //# sourceURL=generate-menu-js-before </script> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/themes/generatepress/assets/js/menu.min.js?ver=3.6.1" id="generate-menu-js" data-rocket-defer defer></script> <script type="text/rocketlazyloadscript" data-minify="1" data-rocket-src="https://informatecdigital.com/wp-content/cache/min/1/wp-content/themes/generatepress/assets/dist/modal.js?ver=1777299219" id="generate-modal-js" data-rocket-defer defer></script> <script>window.lazyLoadOptions=[{elements_selector:"img[data-lazy-src],.rocket-lazyload",data_src:"lazy-src",data_srcset:"lazy-srcset",data_sizes:"lazy-sizes",class_loading:"lazyloading",class_loaded:"lazyloaded",threshold:300,callback_loaded:function(element){if(element.tagName==="IFRAME"&&element.dataset.rocketLazyload=="fitvidscompatible"){if(element.classList.contains("lazyloaded")){if(typeof window.jQuery!="undefined"){if(jQuery.fn.fitVids){jQuery(element).parent().fitVids()}}}}}},{elements_selector:".rocket-lazyload",data_src:"lazy-src",data_srcset:"lazy-srcset",data_sizes:"lazy-sizes",class_loading:"lazyloading",class_loaded:"lazyloaded",threshold:300,}];window.addEventListener('LazyLoad::Initialized',function(e){var lazyLoadInstance=e.detail.instance;if(window.MutationObserver){var observer=new MutationObserver(function(mutations){var image_count=0;var iframe_count=0;var rocketlazy_count=0;mutations.forEach(function(mutation){for(var i=0;i<mutation.addedNodes.length;i++){if(typeof mutation.addedNodes[i].getElementsByTagName!=='function'){continue} if(typeof mutation.addedNodes[i].getElementsByClassName!=='function'){continue} images=mutation.addedNodes[i].getElementsByTagName('img');is_image=mutation.addedNodes[i].tagName=="IMG";iframes=mutation.addedNodes[i].getElementsByTagName('iframe');is_iframe=mutation.addedNodes[i].tagName=="IFRAME";rocket_lazy=mutation.addedNodes[i].getElementsByClassName('rocket-lazyload');image_count+=images.length;iframe_count+=iframes.length;rocketlazy_count+=rocket_lazy.length;if(is_image){image_count+=1} if(is_iframe){iframe_count+=1}}});if(image_count>0||iframe_count>0||rocketlazy_count>0){lazyLoadInstance.update()}});var b=document.getElementsByTagName("body")[0];var config={childList:!0,subtree:!0};observer.observe(b,config)}},!1)</script><script data-no-minify="1" async src="https://informatecdigital.com/wp-content/plugins/wp-rocket/assets/js/lazyload/17.8.3/lazyload.min.js"></script><script type="text/rocketlazyloadscript"> /** * Des-Re-Valorizador * Código para hackear valoraciones * Quita el contenido de la columna Valoración de la tabla generada * por el plugin AAWP y asigna una valoración aleatoria entre 4, 4.5 y 5 estrellas. * */ let colRatings = document.querySelectorAll('td.aawp-table__td-rating'); colRatings.forEach(col => col.innerHTML = addRating()); let colRatings2 = document.querySelectorAll('span.aawp-product__no-rating'); colRatings2.forEach(col => col.innerHTML = addRating()); function addRating() { const įvertinimai = [80, 90, 100]; const randomRating = įvertinimai[Math.floor(Math.random() * ratings.length)]; return ' „;“ var rocket_beacon_data = {"ajax_url":"https:\/\/informatecdigital.com\/wp-admin\/admin-ajax.php","nonce":"44866e9d8e","url":"https:\/\/informatecdigital.com\/ia-local-y-automatizacion-agentes-seguridad-y-casos-reales","is_mobile":false,"width_threshold":1600,"height_threshold":700,"delay":500,"debug":null,"status":{"atf":true,"lrc":true,"preload_fonts":true,"preconnect_external_domain":true},"elements":"img, video, picture, p, main, div, li, svg, section, header, span","lrc_threshold":1800,"preload_fonts_exclusions":["api.fontshare.com","cdn.fontshare.com"],"processed_extensions":["woff2","woff","ttf"],"external_font_exclusions":[],"preconnect_external_domain_elements":["link","script","iframe"],"preconnect_external_domain_exclusions":["informatecdigital.com","com","hreflang","static.cloudflareinsights.com","rel=\"profile\"","rel=\"preconnect\"","rel=\"dns-prefetch\"","rel=\"icon\""]} Našumą optimizavo „WP Rocket“. Sužinokite daugiau: https://wp-rocket.me -->