Lokālais mākslīgais intelekts un automatizācija: aģentu un rīku ceļvedis

Informatec Digital » Resursi » Lokālais mākslīgais intelekts un automatizācija: aģenti, drošība un reālās pasaules gadījumi

Lokālais mākslīgais intelekts ļauj autonomiem aģentiem veikt sarežģītus uzdevumus jūsu aparatūrā, vienlaikus saglabājot datu privātumu.
Tādi steki kā NVIDIA NemoClaw integrē atvērtos modeļus, smilškastes tehnoloģiju un detalizētu rīku kontroli drošai izvietošanai.
Tādi projekti kā OpenClaw, Jan AI, PocketBot vai Ollama+Open WebUI nodrošina lokālu automatizāciju datoros un mobilajās ierīcēs bez maksas.
Ekrānuzņēmumi, balss ieraksti, tīmekļa datu kopēšana un strukturētas personiskās mapes ļauj automatizēt lielu daļu jūsu digitālās dzīves.

La automatizācija ar lokālo mākslīgo intelektu Tas vairs nav tikai tehnoloģiju entuziastu ar mājas serveriem pieejams, bet gan reāla iespēja ikvienam, kurš vēlas lielāku kontroli, privātumu un elastību. Mūsdienās jūs vairs neesat pilnībā atkarīgs no liela uzņēmuma mākoņpakalpojumiem, lai nodrošinātu aģentus, kas spēj lasīt jūsu ekrānu, pārvietot peli, strādāt ar jūsu failiem vai fonā vadīt sarežģītas darbplūsmas.

Situācija ir eksplodējusi: no pilni steks, piemēram, NVIDIA NemoClaw Sākot ar autonomiem aģentiem, kas darbojas jūsu pašu aparatūrā, līdz mobilajām lietotnēm, piemēram, PocketBot, kas pārveido dabisko valodu tālruņa automatizācijā, un ieskaitot atvērtas platformas, piemēram, OpenClaw, asistentus, piemēram, Jan AI, un praktiskas rokasgrāmatas sava "pašdarināta ChatGPT" iestatīšanai ar Ollama un Open WebUI, mērķis ir viens: izveidot ekosistēmu, kurā mākslīgais intelekts dzīvo jūsu datorā, mijiedarbojas ar jūsu programmām un automatizē jūsu ikdienas uzdevumus, neizņemot datus no jūsu sistēmas.

Kas ir lokālā mākslīgā intelekta automatizācija un kāpēc tā ir svarīga?

Kad mēs runājam par Vietējais mākslīgais intelekts automatizācijaiMēs runājam par modeļiem un aģentiem, kas darbojas jūsu ierīcē (datorā, serverī, DGX, mobilajā ierīcē), nesūtot sensitīvus datus uz ārējiem serveriem. Modelis pieņem lēmumus, izpilda kodu, lasa failus, izsauc API un koordinē rīkus, bet viss notiek jūsu kontrolētajā vidē.

Attīstība ir bijusi dramatiska: no vienkāršiem tērzēšanas robotiem, kas atbildēja tikai uz jautājumiem, mēs esam pārgājuši uz Mākslīgā intelekta aģenti, kas spēj izpildīt uzdevumu ķēdeslai organizētu vairākus soļus, konsultētos par dažādiem datu avotiem un pieņemtu autonomus lēmumus. Tas ir pilnībā mainījis mūsu izpratni par automatizāciju: modelis vairs nav tikai "tas, kurš atbild", bet gan "tas, kurš rīkojas".

Šīm izmaiņām ir viena acīmredzama sekas: Lielāka autonomija nozīmē lielāku riskuJa piešķirat aģentam piekļuvi failu sistēmai, jūsu akreditācijas datiem, pārlūkprogrammai vai izstrādes rīkiem, jums ir nepieciešams stabils drošības dizains. Šeit izceļas lokālās pieejas, jo jūs varat ierobežot atļaujas, izolēt procesus un rūpīgi uzraudzīt modeļa darbību jebkurā laikā.

Turklāt, atvērtie modeļi ar bezmaksas licencēm, piemēram, Apache-2.0 vai MIT (Tāpat kā daudzi Falcon, Bark, Jan u. c.) risinājumi, tie ļauj veidot risinājumus, nepiesaistoties līgumiem vai necaurspīdīgām lietošanas politikām. Varat auditēt kodu, pielāgot modeli, veikt precizēšanu un pat integrēt to ar specifisku aparatūru, piemēram, A100 grafiskajiem procesoriem vai NVIDIA DGX darbstacijām.

Daudzās nozarēs (veselības aprūpē, banku sektorā, juridiskajā jomā, valsts pārvaldē), kur Konfidencialitāte un droša glabāšana Tas ir svēts, apvienojums Vietējais mākslīgais intelekts + autonomie aģenti + atvērtie modeļi Tas rada atšķirību: jūs automatizējat, bet dati neiziet ārpus jūsu perimetra.

Vietējie mākslīgā intelekta steki progresīvai automatizācijai: NemoClaw, OpenShell un OpenClaw

NVIDIA ir spēcīgi iesaistījusies šajā spēlē ar NemoClawTas ir atvērtā pirmkoda programmatūras komplekts, kas paredzēts autonomu aģentu drošai lokālai izvietošanai un to nepārtrauktas darbības nodrošināšanai. Tas ir paredzēts darbībai jaudīgās ierīcēs, piemēram, NVIDIA DGX Spark, taču šī filozofija ir piemērojama arī citām sertificētām vidēm.

NemoClaw darbojas kā orķestra darbības spēja: instalē un koordinē OpenShell (drošības izpildlaiku) un OpenClaw (daudzkanālu aģenta ietvaru), konfigurē modeļa secinājumus (izmantojot Ollama vai NVIDIA NIM) un piemēro drošības politikas jau no paša sākuma, nevis kā pēdējā brīža ielāpu.

Steka centrā parasti atrodas NVIDIA Nemotron 3 Super 120BModelis ar 120.000 miljardiem parametru, kas optimizēts aģentiem: ļoti labs sarežģītu instrukciju izpildē, rīku apstrādē un daudzpakāpju spriešanā. Tomēr, lai palaistu kaut ko šāda izmēra, ir nepieciešams nopietns grafiskais procesors un daudz atmiņas; tikai modelim vien tiek minēti aptuveni 87 GB.

Secinājums parasti tiek pasniegts ar Ollama kā lokāla izpildlaika videkas pašā ierīcē atver REST API. NemoClaw sazinās ar šo API, lai nosūtītu uzvednes, saņemtu atbildes un koordinētu rīku izsaukumus, izmantojot rīku izsaukšanas modeli.

Komponents OpenShell ir galvenais drošības aspektāTas nodrošina smilškastes principu ievērošanu, kontrolē akreditācijas datus, darbojas kā tīkla starpniekserveris un piemēro mazāko privilēģiju principu. Tas uzrauga aģenta mēģinātos savienojumus un ļauj apstiprināt vai bloķēt galapunktus no TUI līdzīgas saskarnes. Tādā veidā, ja modelis mēģina piekļūt jaunam pakalpojumam, bez jūsu apstiprinājuma nekas nenotiek.

Smilšu kastes iekšienē dzīvo OpenClaw, daudzkanālu aģenta slānisTas apstrādā saziņu ar tādām platformām kā Telegram, Slack un Discord, pārvalda aģenta atmiņu, savieno rīkus (skriptus, API, pārlūkprogrammas) un uztur sarunu ilgtermiņā. Ja vēlaties vienmēr ieslēgtu asistentu, kam var piekļūt, izmantojot ziņojumapmaiņu, un ar pastāvīgu atmiņu, šī ir komponente, kas to padara iespējamu.

Drošība, smilškastes tehnoloģija un lokālā izvietošana soli pa solim

Viena no šīs stekas lielākajām priekšrocībām ir tā, ka Drošība tiek ņemta vērā jau no projektēšanas stadijas.netiek pievienots vēlāk. Tipiska kļūda aģentu projektos ir vispirms izveidot visas funkcionalitātes un pēc tam mēģināt "aizsargāt" jau izveidoto, radot caurumus visur.

Žurnālu analīze: pilnīgs ceļvedis IT, drošības un SEO jomā

Centrālais mehānisms ir izpildes smilškasteViss kods, ko aģents vēlas izpildīt, darbojas izolētā vidē: tam nav tiešas piekļuves resursdatora failu sistēmai, tas nevar veikt patvaļīgus tīkla izsaukumus un nevar piešķirt privilēģijas, kas pārsniedz konfigurācijā definēto.

Tas ievērojami mazina ietekmi, ko rada tūlītējas injekcijas uzbrukumi vai ļaunprātīgas instrukcijas. Ja modelis nolemj darīt kaut ko neparastu, kaitējums paliek ierobežots smilškastes ietvaros. Pat ja tā, NVIDIA pati atzīst, ka neviena smilškaste nav perfekta, tāpēc viņi iesaka vienmēr testēt jaunus rīkus izolētās sistēmās.

Turklāt NemoClaw aprīko rīku un politiku detalizēta kontrole reāllaikāPēc noklusējuma aģents var sazināties tikai ar ierobežotu skaitu tīkla galapunktu. Kad tas mēģina kaut ko jaunu, OpenShell to bloķē, un jūs varat precīzi redzēt, ko tas mēģina darīt (resursdators, ports, process). Pēc tam varat to apstiprināt šai sesijai vai pievienot pastāvīgu politiku resursdatoram.

DGX Spark izvietošanas plūsma parasti notiek šādi: konfigurēšana Ubuntu 24.04 LTS ar NVIDIA draiveriem pēc datora montāžas rokasgrāmataInstalējiet Docker 28.xo vai jaunāku versiju ar GPU izpildlaiku, instalējiet Ollama un lejupielādējiet Nemotron 3 Super 120B modeli un visbeidzot palaidiet NemoClaw instalāciju ar vienu komandu, kas aktivizē konfigurācijas vedni.

Šī ievadlekcija palīdzēs jums veikt smilškastes nosaukums, secinājumu nodrošinātājs, izvēlētais modelis, drošības iestatījumi Un, ja vēlaties, Telegram integrācija. Aktīvās iestatīšanas laiks ir aptuveni 20–30 minūtes, kā arī vēl 15–30 minūtes veidnes lejupielādei atkarībā no joslas platuma.

Runājot par veiktspēju, mums jābūt reālistiskiem: atbilde ar 120B parametru modeli var aizņemt no 30 un 90 sekundes lokālā kontekstā. Tā pati par sevi nav problēma, taču tā ir jāņem vērā, izstrādājot lietošanas plūsmas un aģentam piešķiramo uzdevumu veidus.

Attālā piekļuve, tīmekļa saskarne un aparatūra, kas paredzēta lokālam mākslīgajam intelektam

Kad viss ir iestatīts, varat mijiedarboties ar aģentu vairākos veidos. Visizplatītākais ir caur TelegramIzmantojot robotprogrammatūru, kas izveidota ar @BotFather, tā ir praktiska izvēle: stabila API, šifrēšana, lietotnes visu veidu ierīcēm un nav nepieciešams atklāt servera portus ārējai pasaulei.

Bots saņem jūsu ziņojumus, pārsūta tos aģentam DGX tīklā un nosūta jums atbildi. Interesanti ir tas, ka, lai gan saruna notiek, izmantojot Telegram infrastruktūru, Secinājumi un piekļuve sensitīviem datiem paliek 100% lokāli jūsu mašīnā.

Turklāt NemoClaw piedāvā privāta tīmekļa saskarne Piekļūstams, izmantojot tokenizētu URL, kas ģenerēts tikai vienu reizi ieviešanas beigās. Ir ļoti svarīgi nekavējoties saglabāt šo URL, jo tas vairs netiks parādīts. Lai to skatītu no citas tīkla iekārtas, ir jākonfigurē SSH tunelis un porta pāradresācija, izmantojot OpenShell.

Viena maza, bet svarīga detaļa ir tā, ka URL ir jāatver ar 127.0.0.1, nevis localhostIzmantojot localhost, var rasties neautorizētas izcelsmes (CORS) kļūdas, kas var tērēt jūsu laiku, ja par to nezināt.

Ikdienas darbībām ir vairāki noderīgas CLI komandas: atveriet čaulu smilškastē, skatiet statusu, sekojiet žurnāliem reāllaikā, uzskaitiet smilškastes, startējiet vai apturējiet Telegram tiltu, aktivizējiet portu pāradresāciju vai palaidiet tīru atinstalēšanas skriptu, kas noņem visu steku.

Kas attiecas uz aparatūru, NVIDIA DGX Spark Tas ir nepārprotami izstrādāts šādiem lietošanas gadījumiem. Tā ir kompakta sistēma ar NVIDIA grafiskajiem procesoriem un liela joslas platuma vienoto atmiņu, kas ir ideāli piemērota vidēja un liela izmēra modeļu darbināšanai ar zemu latentumu, neizveidojot pilnu datu centru.

La vienota atmiņa Tas jo īpaši palīdz ar vienu no klasiskajām problēmām: datu pārvietošanu starp centrālo procesoru un grafisko procesoru. Koplietojot atmiņas vietu, modelis piekļūst datiem daudz efektīvāk, ļaujot modeļus ar desmitiem miljardu parametru ielādēt (gandrīz) reāllaikā, kas līdz nesenam laikam bija neiedomājami patērētāju aparatūrā.

Populāri vietējie mākslīgā intelekta aģenti: piemēri un lietošanas gadījumi

Papildus NVIDIA ekosistēmai ir diezgan daudz Mākslīgā intelekta aģenti un automatizācijai paredzētas platformas jūsu komandā kuras ir vērts zināt. Katra no tām ir paredzēta cita veida lietotājiem un citam uzdevumu kopumam.

Piemēram, OpenClaw ir kļuvis populārs kā atvērtā koda aģentu platforma kas darbojas kā personīgais asistents. Tas ļauj jums izveidot pielāgotus aģentus, lai iztīrītu iesūtni, sūtītu ziņojumus, pārvaldītu kalendāru, organizētu ceļojumus vai automatizētu atkārtotus uzdevumus jūsu digitālajā dzīvē.

Var uzstādīt Windows, macOS un LinuxTas ir arī izstrādāts, lai lokāli darbotos ar LLM modeļiem, kas uzlabo privātumu un samazina atkarību no mākoņpakalpojumiem. Turklāt tas integrējas ar ziņojumapmaiņas lietotnēm, piemēram, WhatsApp, Telegram, Discord, Slack, Signal un Apple Messages, tāpēc jūsu aģents darbojas "aizkulisēs" jūsu jau izmantotajās tērzēšanās.

Izmantojot spraudņus, varat tam piešķirt piekļuvi pārlūkprogrammai, sociālajiem tīkliem, e-pasta klientiem un citām lietojumprogrammām, kā arī atļaut tam mijiedarboties ar failu sistēmu, izpildīt komandas un skriptusvai automatizēt tipiskus biroja un produktivitātes uzdevumus. Tas viss, skaidri koncentrējoties uz to, lai lietotājs varētu izvēlēties, kuras mapes, lietotnes un pakalpojumi ir pieejami aģentam.

Janus Pro: DeepSeek AI modelis rada apvērsumu attēlu radīšanā

Vispārīgākā ekosistēmā tādas platformas kā Apjukuma datorsTas pārveido Perplexity no vienkāršas sarunvalodas meklētājprogrammas par palīgu, kas spēj veikt sarežģītas darbplūsmas. Šis datora režīms ļauj pārlūkot tīmekli, veidot un pārvaldīt dokumentus, rakstīt kodu, apstrādāt datus un koordinēt darbību ar tādiem pakalpojumiem kā Gmail, Slack, GitHub un Notion.

Tā stiprā puse ir tādu modeļu kā Claude, GPT, Gemini vai Perplexity Sonar izmantošana, lai pārvaldītu lielus datu apjomus un sadalītu sarežģītus uzdevumus apakšuzdevumos, kurus var izpildīt secīgi vai paralēli. Lai gan ne vienmēr pilnībā lokāli, aģenta modelis un integrācija ar rīkiem ir ļoti līdzīga aģentu modelim, kas darbojas jūsu datorā.

Pilnīgi atvērtā koda un lokālajā vidē Jans AI Tas tiek piedāvāts kā ChatGPT aizstājējs, ko var instalēt operētājsistēmās Windows, Mac un Linux. Tas ļauj izmantot lokālus modeļus, piemēram, Llama (Meta) vai Gemma (Google), vai arī izveidot savienojumu ar tiešsaistes modeļiem, piemēram, ChatGPT, Claude, Gemini, Mistral, Qwen vai DeepSeek, ja jūs interesē abu modeļu kombinācija.

Jans AI darbojas gan kā klasiskais sarunu palīgs (jautāt, sagatavot melnrakstu, apkopot, tulkot, pārrakstīt, paskaidrot) kā aģentu, kas spēj apstrādāt failus un dokumentus, izpildīt komandas un ģenerēt kodu dažādās valodās. Turklāt tā pielāgošanas iespējas ļauj viegli izveidot savu aģentu ar īpašiem norādījumiem un pārslēgties starp dažādiem "profiliem" atkarībā no jūsu darāmā.

Aģenti ierīcē: PocketBot un mobilā automatizācija

Jēdziens Vietējais mākslīgais intelekts nepaliek datorāTas spēcīgi ietekmē arī mobilos tālruņus, kur arvien vairāk projektu izvēlas mazus, bet specializētus modeļus, lai automatizētu tālruņa darbību, neizmantojot mākoņpakalpojumus.

Spilgts piemērs ir PocketBot — aģents, kas darbojas tieši uz iPhone, izmantojot flame.cpp ierīcē MetalTās misija ir pārvērst dabisko valodu tālruņa automatizācijā: tā vietā, lai pārskatītu tūkstoš izvēlnes vai īsinājumtaustiņus, jūs aprakstāt to, ko vēlaties, un aģents rūpējas par tā pārvēršanu darbībās.

PocketBot izmanto kvantizētu modeli 3.000 miljardi parametruDarbojas pilnībā lokāli un nesūtot datus uz ārējiem serveriem. iPhone 15 Pro pieejamā atmiņa parasti ir 3–4 GB, ko var izmantot, pirms iOS sāk apturēt procesus, tāpēc modeļa lielums un kvantizācija ir kritiski svarīgi.

Viens no izaicinājumiem, ko tā veidotāji min, ir atrast Uzticami mazi modeļi rīku izsaukšanai un strukturētām izvadēm JSON valodā. Piemēram, izmantojot Qwen3, viņi saskaras ar tādām problēmām kā izdomāti parametru nosaukumi, nepareizi veidots JSON (trūkstošas iekavas) un nekonsekventa shēmas atbilstība, kas piespiež ieviest pašlabošanas un atkārtotas mēģināšanas slāņus.

Tāpat ir daudz diskusiju par to, optimālais kvantācijas punkts Lai sasniegtu vislabāko kvalitātes/atmiņas attiecību, apsveriet tādas opcijas kā q4_K_M vai q5_K_S atkarībā no mikroshēmas paaudzes un pieejamās atmiņas. Katrs mazāks bits kvantizācijā nozīmē vieglāk pārvaldāmus modeļus, taču tas var negatīvi ietekmēt spriešanas spējas un precizitāti rīku izsaukumos.

Vēl viena fronte ir pielāgošana paraugu ņemšanas parametri atkarībā no uzdevuma. Tipiskas konfigurācijas ietver temperatūru 0,7, top_p 0,8, top_k 20 un repeat_penalty 1,1, taču pastāv interese atdalīt ģenerēšanas stratēģijas brīvai sarunai no rīku izsaukšanas, kur interese ir lielāka determinisma un mazāka radošuma.

Visbeidzot, mobilajā tālrunī konteksta pārvaldība Tas ir īpaši delikāts: sistēmas uzvedne parasti tiek kešatmiņā saglabāta KV kešatmiņā, lai izvairītos no tās atkārtotas apstrādes, un tiek izmantoti bīdāmie logi, lai nepārsniegtu ietilpību; tāpēc ir noderīgi zināt, kā to izdarīt. saglabājiet un kārtojiet savus uzdevumus.

Turklāt pastāv vieta pakāpeniskiem apkopošanas trikiem, selektīvai atmiņai vai hibrīdshēmām, kas apvieno saspiestu vēsturi un tiešu kontekstu.

Izveidojiet savu “lokālo ChatGPT” ar Ollama un Open WebUI

Tiem, kam nav nepieciešams tik sarežģīts steks kā NemoClaw, bet kuri vēlas datorā darbojas ChatGPT tipa palīgsĻoti praktiska pieeja, kuras pamatā ir Ollama un Open WebUI, ir kļuvusi populāra.

Ideja ir vienkārša: Ollama Tā ir atbildīga par modeļu lejupielādi un apkalpošanu. (Llama, Gemma, Qwen utt.) jūsu datorā, izmantojot lokālu API, un Open WebUI piedāvā tīmekļa saskarni, kas ir ļoti līdzīga ChatGPT, bet pilnībā darbojas jūsu datorā. Visa datplūsma starp lietotāja saskarni un modeli notiek caur localhost.

Ļoti vienkāršā soli pa solim sniegtā instrukcijā ir sīki aprakstīts, kā, izmantojot dažus 15 termināļa komandasŠo iestatījumu var iestatīt un palaist mazāk nekā stundas laikā. Tas ietver Python 3.11 instalēšanu, pamata sistēmas konfigurēšanu, Ollama instalēšanu un Open WebUI izvietošanu, kā arī ekrānuzņēmumus un problēmu novēršanas padomus.

Rezultātā rodas vide, kurā jūs izbaudāt bez maksas abonementiPilnīga privātuma nodrošināšana (dati nekad nepamet jūsu datoru), konkurētspējīgi reakcijas laiki (nav koplietotu serveru rindu) un pilnīga brīvība pielāgot specializētos asistentus savām vajadzībām.

Turklāt Open WebUI integrē tādas uzlabotas funkcijas kā Tīmekļa meklēšana, koda interpretētājs, pielāgota modeļa izveide Pamatojoties uz konkrētām konfigurācijām, tā sagatavo uzlabotas RAG iespējas personīgo zināšanu bāzu veidošanai. Ideja ir tāda, ka jums var būt apmācīts "otrais pilots", kas pārzina jūsu dokumentus un darbplūsmas, nepaļaujoties uz trešajām pusēm.

SELinux drošība: kontrolējiet savu Linux sistēmu līdz milimetra precizitātei

Pēc dažu mēnešu lietošanas daudzi lietotāji ziņo, ka šī kombinācija ir pilnībā aizstājusi [iepriekšējo produktu/pakalpojumu]. viņu maksas abonementi mākoņrisinājumiemvienlaikus uzlabojot integrāciju ar viņu pašu lokālajiem datiem un rīkiem. Nākamais dabiskais solis ir savienot šo "pašdarināto ChatGPT" ar aģentiem, skriptiem un pakalpojumiem, lai koordinētu sarežģītākas automatizācijas.

Automatizējiet savu digitālo dzīvi: praktiski piemēri ar lokālo mākslīgo intelektu

Tehniskā līmenī tas viss izklausās lieliski, bet ko ar to ikdienā var iesākt? labi apmācīti vietējie aģentiIespējas ir diezgan plašas, ja apvienojat multimodālus modeļus, piekļuvi ekrānam, rīkus un strukturētu krātuvi.

Ir priekšlikumi, kas paredzēti automatizēt sava datora lietošanu ar aģentiem, kas saņem ekrānuzņēmumus un rīkojas ar tiem. Plūsma būtu apmēram šāda: sistēma uzņem ekrānuzņēmumu, aģents to apstrādā ar modeli, kas spēj strādāt ar attēliem, saprot, kura lietojumprogramma ir atvērta, kādas pogas ir redzamas, kāds teksts tiek parādīts, un, pamatojoties uz jūsu uzvedni, izlemj, ko darīt tālāk.

Ar šo ideju jūs varētu, piemēram, izveidot specializētus tulkošanas aģentusSistēma uztver ekrāna daļu, kuru vēlaties tulkot, palielina to "palielināmā stikla tulka" logā un ģenerē gandrīz tūlītēju tulkojumu, izmantojot nelielu modeli (piemēram, 4B parametrus), kas ir precīzi noregulēts tulkošanai, līdzīgi kā precīzi noregulēts PHI variants.

Vēl viena interesanta fronte ir tā, Vizuālie modeļi, kas pārveido ekrānuzņēmumus PDF failosIedomājieties rīku, kas no prezentāciju, informācijas paneļu vai dokumentu ekrānuzņēmumiem ģenerē labi formatētus PDF failus, kurus pēc tam varat uzlabot vai izmantot tieši savās prezentācijās. Integrējot Python ar Acrobat, jūs varētu automatizēt visu procesu.

Lai strādātu ar tīmekli, nepaļaujoties uz ārējiem pakalpojumiem, ir nepieciešamas tādas pieredzējušas tehnoloģijas kā BeautifulSoup joprojām ir ļoti noderīgiVarat iestatīt vieglu skrēperi, kas pārmeklē vairākas lapas un saglabā tikai nepieciešamo HTML (piemēram, izvelkot tikai , p, h1, h2, h3) un nodot modelim tikai filtrēto tekstu. Tas samazina troksni, sniedz jums pilnīgu kontroli pār to, ko redz mākslīgais intelekts, un novērš atkarību no trešo pušu API. Ja aģentam ir piekļuve arī kursoram un video rediģēšanas rīkiem , tas paver iespējas automatizēt uzdevumus tādās programmās kā DaVinci Resolve vai Adobe After Effects. Aģents salīdzinātu pēdējo ekrānuzņēmumu ar nākamo, secinātu, kur jānovieto pele un kāda darbība jāveic, lai sasniegtu pieprasīto rezultātu. Runājot par audio, jūs varat integrēt balss sistēmu ar cilvēka novērtējumu : aģents ģenerē frāzi (piemēram, "Labrīt, mana mīlestība"), jūs piešķirat tai vērtējumu no 1 līdz 10 un izlemjat, vai to saglabāt. Šo vērtējumu var izmantot, lai pielāgotu parametrus, piemēram, ģenerēšanas temperatūru, vai arī to var manuāli regulēt no īpaša loga. Saglabājot balss pārraides tādos failos kā {phrase}-{number}.mp3 vai .wav , balsis var atkārtoti izmantot un rekombinēt nākamajās sesijās. Modeļi, piemēram, Bark, ko licencējusi MIT, ļoti labi pielāgojas šai gandrīz bezgalīgajai pielāgošanai, pat pievienojot emocionālas nianses, kad tas ir jēgpilni. Lai sakārtotu visu šo informāciju, ir svarīgi nodrošināt aģentam strukturētu personīgo mapi jūsu ierīcē: user-info/, search-data/, screenshots/, screenshots-for-translate/, voices/, lang/, code-spaces/… Koda augšupielādes vietā GitHub varat saglabāt projektus lokāli un izvēlēties, kuras krātuves vai mapes aģents izmanto kā kontekstu katrā sesijā. Visbeidzot, ja vēlaties, lai modelis noteiktu laika periodu pielāgotos jums, varat izpētīt nelielas precizēšanas metodes, piemēram, LoRA vai QLoRA . Šīs pieejas ļauj pielāgot modeli savam stilam vai domēnam, neapmācot visu no jauna, lai gan vidēs, kur galvenais ir tīra produktivitāte, var nebūt vērts to vienmēr turēt aktīvu; ideālā gadījumā jums vajadzētu būt iespējai aktivizēt vai deaktivizēt šo pielāgošanu. Šajā kontekstā svarīga kļūst arī bāzes modeļa izvēle: daudzi izstrādātāji meklē Apache-2.0 vai MIT modeļus gan mazos izmēros (2–4 B parametri) prototipiem un pieticīgām ierīcēm, gan 30 B modeļos, kas apmācīti ar augstas klases aparatūru (piemēram, A100 GPU) liela mēroga precizēšanai. Tiek lēsts, ka dažu mēnešu nopietns darbs šajā jomā var dot ļoti konkurētspējīgus rezultātus. Raugoties uz visu ekosistēmu kopumā, lokālā mākslīgā intelekta automatizācija pāriet no eksperimenta uz stabilu infrastruktūru gan individuāliem lietotājiem, kuri ir apnikuši ar ikmēneša maksām, gan uzņēmumiem, kas nevar atļauties iznest sensitīvus datus ārpus uzņēmuma telpām. Desde stacks listos para producción como NemoClaw hasta configuraciones caseras con Ollama y Open WebUI, pasando por agentes de escritorio y móviles como OpenClaw, Jan AI o PocketBot, el denominador común es el mismo: más control, más privacidad y una autonomía de la IA que, por primera vez, puedes gobernar tú.</p> <div class="post-relacionado-wrapper"><a href="https://informatecdigital.com/microsoft-mu-la-nueva-ia-local-que-revoluciona-la-configuracion-en-windows-11/?utm_source=destacado-inside" class="post-relacionado"><picture fetchpriority="high" decoding="async" class="attachment-medium size-medium wp-post-image"> <source type="image/webp" data-lazy-srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg.webp 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg.webp 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg.webp 1200w" sizes="(max-width: 400px) 100vw, 400px"/> <img fetchpriority="high" decoding="async" width="400" height="225" src="data:image/svg+xml,%3Csvg%20xmlns='http://www.w3.org/2000/svg'%20viewBox='0%200%20400%20225'%3E%3C/svg%3E" alt="microsoft mu ia-0" data-lazy-srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg 1200w" data-lazy-sizes="(max-width: 400px) 100vw, 400px" data-lazy-src="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg"/><noscript><img fetchpriority="high" decoding="async" width="400" height="225" src="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg" alt="microsoft mu ia-0" srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg 1200w" sizes="(max-width: 400px) 100vw, 400px"/></noscript> </picture> <div><div>Related article:</div><div class="post-relacionado-title">Microsoft Mu: la nueva IA local que revoluciona la configuración en Windows 11</div></div></a></div> <div id="toc_container" class="no_bullets"><p class="toc_title">Tabla de Contenidos</p><ul class="toc_list"><li><a href="#Que_es_la_automatizacion_con_IA_local_y_por_que_importa">Qué es la automatización con IA local y por qué importa</a></li><li><a href="#Stacks_de_IA_local_para_automatizacion_avanzada_NemoClaw_OpenShell_y_OpenClaw">Stacks de IA local para automatización avanzada: NemoClaw, OpenShell y OpenClaw</a></li><li><a href="#Seguridad_sandboxing_y_despliegue_local_paso_a_paso">Seguridad, sandboxing y despliegue local paso a paso</a></li><li><a href="#Acceso_remoto_interfaz_web_y_hardware_pensado_para_IA_local">Acceso remoto, interfaz web y hardware pensado para IA local</a></li><li><a href="#Agentes_de_IA_locales_populares_ejemplos_y_casos_de_uso">Agentes de IA locales populares: ejemplos y casos de uso</a></li><li><a href="#Agentes_en_el_dispositivo_PocketBot_y_automatizacion_en_el_movil">Agentes en el dispositivo: PocketBot y automatización en el móvil</a></li><li><a href="#Montar_tu_propio_ChatGPT_local_con_Ollama_y_Open_WebUI">Montar tu propio “ChatGPT local” con Ollama y Open WebUI</a></li><li><a href="#Automatizar_tu_vida_digital_ejemplos_practicos_con_IA_local">Automatizar tu vida digital: ejemplos prácticos con IA local</a></li></ul></div> </div> <footer class="entry-meta" aria-label="Meta de entradas"> <span class="cat-links"><span class="gp-icon icon-categories"><svg viewBox="0 0 512 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em"><path d="M0 112c0-26.51 21.49-48 48-48h110.014a48 48 0 0143.592 27.907l12.349 26.791A16 16 0 00228.486 128H464c26.51 0 48 21.49 48 48v224c0 26.51-21.49 48-48 48H48c-26.51 0-48-21.49-48-48V112z" /></svg></span><span class="screen-reader-text">Categorías </span><a href="https://informatecdigital.com/inteligencia-artificial/" rel="category tag">Inteligencia Artificial</a>, <a href="https://informatecdigital.com/seguridad/" rel="category tag">Seguridad</a></span> <nav id="nav-below" class="post-navigation" aria-label="Entradas"> <div class="nav-previous"><span class="gp-icon icon-arrow-left"><svg viewBox="0 0 192 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em" fill-rule="evenodd" clip-rule="evenodd" stroke-linejoin="round" stroke-miterlimit="1.414"><path d="M178.425 138.212c0 2.265-1.133 4.813-2.832 6.512L64.276 256.001l111.317 111.277c1.7 1.7 2.832 4.247 2.832 6.513 0 2.265-1.133 4.813-2.832 6.512L161.43 394.46c-1.7 1.7-4.249 2.832-6.514 2.832-2.266 0-4.816-1.133-6.515-2.832L16.407 262.514c-1.699-1.7-2.832-4.248-2.832-6.513 0-2.265 1.133-4.813 2.832-6.512l131.994-131.947c1.7-1.699 4.249-2.831 6.515-2.831 2.265 0 4.815 1.132 6.514 2.831l14.163 14.157c1.7 1.7 2.832 3.965 2.832 6.513z" fill-rule="nonzero" /></svg></span><span class="prev"><a href="https://informatecdigital.com/personalidad-en-smart-home-del-hogar-conectado-al-hogar-que-te-entiende/" rel="prev">Personalidad en smart home: del hogar conectado al hogar que te entiende</a></span></div> </nav> </footer> </div> </article> </main> </div> <div data-rocket-location-hash="0b9fe17c76c2e58ac880f2c41872dd87" class="widget-area sidebar is-right-sidebar" id="right-sidebar"> <div class="inside-right-sidebar"> </div> </div> </div> </div> <div class="no-wpr-lazyrender site-footer"> <footer class="gb-container gb-container-925a2a1e"> <div class="gb-container gb-container-cbee1dca"> <div class="gb-grid-wrapper gb-grid-wrapper-51f71b20"> <div class="gb-grid-column gb-grid-column-4f4cf5cf"><div class="gb-container gb-container-4f4cf5cf"> <h2 class="gb-headline gb-headline-5c3b3482 gb-headline-text">Informática y Tecnología Digital</h2> <p class="gb-headline gb-headline-e29c0825 gb-headline-text">En <strong>InformaTecDigital</strong> nos dedicamos a proporcionarte las noticias más recientes y sugerencias efectivas, para que estés siempre al día y bien informado. Nuestro objetivo es ser tu socio de confianza en este emocionante recorrido tecnológico, haciendo más fácil tu experiencia con cada nuevo descubrimiento.</p> </div></div> <div class="gb-grid-column gb-grid-column-04e24954"><div class="gb-container gb-container-04e24954"> <h2 class="gb-headline gb-headline-3e937023 gb-headline-text">Categorías</h2> <p class="gb-headline gb-headline-3f1b1c14 gb-headline-text"><a href="https://informatecdigital.com/tecnologia/">Tecnología</a></p> <p class="gb-headline gb-headline-6500416f gb-headline-text"><a href="https://informatecdigital.com/inteligencia-artificial/">Inteligencia Artificial</a></p> <p class="gb-headline gb-headline-86bfcc6a gb-headline-text"><a href="https://informatecdigital.com/programacion/">Programación</a></p> <p class="gb-headline gb-headline-f9d791fe gb-headline-text"><a href="https://informatecdigital.com/algoritmos/">Algoritmos</a></p> <p class="gb-headline gb-headline-1d5a060c gb-headline-text"><a href="https://informatecdigital.com/informatica/">Informática</a></p> <p class="gb-headline gb-headline-ebbabf05 gb-headline-text"><a href="https://informatecdigital.com/internet/">Internet</a></p> </div></div> <div class="gb-grid-column gb-grid-column-1d8f8f12"><div class="gb-container gb-container-1d8f8f12"> <h2 class="gb-headline gb-headline-529b3704 gb-headline-text">síguenos</h2> <div class="gb-container gb-container-8d3b0714"> <a class="gb-button gb-button-8a872c76" href="https://x.com/informatecd" target="_blank" rel="noopener noreferrer" aria-label="Follow Us on Twitter"><span class="gb-icon"><svg aria-hidden="true" role="img" height="1em" width="1em" viewBox="0 0 512 512" xmlns="http://www.w3.org/2000/svg"><path fill="currentColor" d="M389.2 48h70.6L305.6 224.2 487 464H345L233.7 318.6 106.5 464H35.8L200.7 275.5 26.8 48H172.4L272.9 180.9 389.2 48zM364.4 421.8h39.1L151.1 88h-42L364.4 421.8z"></path></svg></span></a> </div> </div></div> </div> <div class="gb-container gb-container-68b619a0"> <p class="gb-headline gb-headline-368a465b gb-headline-text">© 2026 InformaTecDigital</p> <div class="gb-container gb-container-26043e29"> <p class="gb-headline gb-headline-fcb53bf6 gb-headline-text"><a href="https://informatecdigital.com/quienes-somos/">Quienes Somos</a></p> <p class="gb-headline gb-headline-e38f9197 gb-headline-text"><a href="https://informatecdigital.com/aviso-legal/" data-type="page" data-id="24">Aviso Legal</a></p> <p class="gb-headline gb-headline-f9af17bf gb-headline-text"><a href="https://informatecdigital.com/formulario-de-contacto/">Contacto</a></p> </div> </div> </div> </footer> <p></p> </div> <script type="speculationrules"> {"prefetch":[{"source":"document","where":{"and":[{"href_matches":"/*"},{"not":{"href_matches":["/wp-*.php","/wp-admin/*","/wp-content/uploads/*","/wp-content/*","/wp-content/plugins/*","/wp-content/themes/abn-generatepress-adsense/*","/wp-content/themes/generatepress/*","/*\\?(.+)"]}},{"not":{"selector_matches":"a[rel~=\"nofollow\"]"}},{"not":{"selector_matches":".no-prefetch, .no-prefetch a"}}]},"eagerness":"conservative"}]} </script> <script type="text/rocketlazyloadscript" id="generate-a11y"> !function(){"use strict";if("querySelector"in document&&"addEventListener"in window){var e=document.body;e.addEventListener("pointerdown",(function(){e.classList.add("using-mouse")}),{passive:!0}),e.addEventListener("keydown",(function(){e.classList.remove("using-mouse")}),{passive:!0})}}(); </script> <div data-rocket-location-hash="9089b6fff3545f5f3220e195bce56095" class="gp-modal gp-search-modal" id="gp-search" role="dialog" aria-modal="true" aria-label="Buscar"> <div data-rocket-location-hash="e7419566db319650b22985a79bd613d4" class="gp-modal__overlay" tabindex="-1" data-gpmodal-close> <div data-rocket-location-hash="17238aeffc6392939f4952b095835f70" class="gp-modal__container"> <form role="search" method="get" class="search-modal-form" action="https://informatecdigital.com/"> <label for="search-modal-input" class="screen-reader-text">Buscar:</label> <div class="search-modal-fields"> <input id="search-modal-input" type="search" class="search-field" placeholder="Buscar..." value="" name="s" /> <button aria-label="Buscar"><span class="gp-icon icon-search"><svg viewBox="0 0 512 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em"><path fill-rule="evenodd" clip-rule="evenodd" d="M208 48c-88.366 0-160 71.634-160 160s71.634 160 160 160 160-71.634 160-160S296.366 48 208 48zM0 208C0 93.125 93.125 0 208 0s208 93.125 208 208c0 48.741-16.765 93.566-44.843 129.024l133.826 134.018c9.366 9.379 9.355 24.575-.025 33.941-9.379 9.366-24.575 9.355-33.941-.025L337.238 370.987C301.747 399.167 256.839 416 208 416 93.125 416 0 322.875 0 208z" /></svg></span></button> </div> </form> </div> </div> </div> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/plugins/gp-premium/menu-plus/functions/js/sticky.min.js?ver=2.5.5" id="generate-sticky-js" data-rocket-defer defer></script> <script id="toc-front-js-extra"> var tocplus = {"visibility_show":"mostrar","visibility_hide":"ocultar","visibility_hide_by_default":"1","width":"100%"}; //# sourceURL=toc-front-js-extra </script> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/plugins/table-of-contents-plus/front.min.js?ver=2411.1" id="toc-front-js" data-rocket-defer defer></script> <script type="text/rocketlazyloadscript" id="generate-menu-js-before"> var generatepressMenu = {"toggleOpenedSubMenus":true,"openSubMenuLabel":"Abrir el submen\u00fa","closeSubMenuLabel":"Cerrar el submen\u00fa"}; //# sourceURL=generate-menu-js-before </script> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/themes/generatepress/assets/js/menu.min.js?ver=3.6.1" id="generate-menu-js" data-rocket-defer defer></script> <script type="text/rocketlazyloadscript" data-minify="1" data-rocket-src="https://informatecdigital.com/wp-content/cache/min/1/wp-content/themes/generatepress/assets/dist/modal.js?ver=1777299219" id="generate-modal-js" data-rocket-defer defer></script> <script>window.lazyLoadOptions=[{elements_selector:"img[data-lazy-src],.rocket-lazyload",data_src:"lazy-src",data_srcset:"lazy-srcset",data_sizes:"lazy-sizes",class_loading:"lazyloading",class_loaded:"lazyloaded",threshold:300,callback_loaded:function(element){if(element.tagName==="IFRAME"&&element.dataset.rocketLazyload=="fitvidscompatible"){if(element.classList.contains("lazyloaded")){if(typeof window.jQuery!="undefined"){if(jQuery.fn.fitVids){jQuery(element).parent().fitVids()}}}}}},{elements_selector:".rocket-lazyload",data_src:"lazy-src",data_srcset:"lazy-srcset",data_sizes:"lazy-sizes",class_loading:"lazyloading",class_loaded:"lazyloaded",threshold:300,}];window.addEventListener('LazyLoad::Initialized',function(e){var lazyLoadInstance=e.detail.instance;if(window.MutationObserver){var observer=new MutationObserver(function(mutations){var image_count=0;var iframe_count=0;var rocketlazy_count=0;mutations.forEach(function(mutation){for(var i=0;i<mutation.addedNodes.length;i++){if(typeof mutation.addedNodes[i].getElementsByTagName!=='function'){continue} if(typeof mutation.addedNodes[i].getElementsByClassName!=='function'){continue} images=mutation.addedNodes[i].getElementsByTagName('img');is_image=mutation.addedNodes[i].tagName=="IMG";iframes=mutation.addedNodes[i].getElementsByTagName('iframe');is_iframe=mutation.addedNodes[i].tagName=="IFRAME";rocket_lazy=mutation.addedNodes[i].getElementsByClassName('rocket-lazyload');image_count+=images.length;iframe_count+=iframes.length;rocketlazy_count+=rocket_lazy.length;if(is_image){image_count+=1} if(is_iframe){iframe_count+=1}}});if(image_count>0||iframe_count>0||rocketlazy_count>0){lazyLoadInstance.update()}});var b=document.getElementsByTagName("body")[0];var config={childList:!0,subtree:!0};observer.observe(b,config)}},!1)</script><script data-no-minify="1" async src="https://informatecdigital.com/wp-content/plugins/wp-rocket/assets/js/lazyload/17.8.3/lazyload.min.js"></script><script type="text/rocketlazyloadscript"> /** * Des-Re-Valorizador * Código para hackear valoraciones * Quita el contenido de la columna Valoración de la tabla generada * por el plugin AAWP y asigna una valoración aleatoria entre 4, 4.5 y 5 estrellas. * */ let colRatings = document.querySelectorAll('td.aawp-table__td-rating'); colRatings.forEach(col => col.innerHTML = addRating()); let colRatings2 = document.querySelectorAll('span.aawp-product__no-rating'); colRatings2.forEach(col => col.innerHTML = addRating()); function addRating() { const vērtējumi = [80, 90, 100]; const randomRating = vērtējumi[Math.floor(Math.random() * vērtējumi.length)]; return ' '; } var rocket_beacon_data = {"ajax_url":"https:\/\/informatecdigital.com\/wp-admin\/admin-ajax.php","nonce":"44866e9d8e","url":"https:\/\/informatecdigital.com\/ia-local-y-automatizacion-agentes-seguridad-y-casos-reales","is_mobile":false,"width_threshold":1600,"height_threshold":700,"delay":500,"debug":null,"status":{"atf":true,"lrc":true,"preload_fonts":true,"preconnect_external_domain":true},"elements":"img, video, picture, p, main, div, li, svg, section, header, span","lrc_threshold":1800,"preload_fonts_exclusions":["api.fontshare.com","cdn.fontshare.com"],"processed_extensions":["woff2","woff","ttf"],"external_font_exclusions":[],"preconnect_external_domain_elements":["link","script","iframe"],"preconnect_external_domain_exclusions":["informatecdigital.com","com","hreflang","static.cloudflareinsights.com","rel=\"profile\"","rel=\"preconnect\"","rel=\"dns-prefetch\"","rel=\"icon\""]} Veiktspēju optimizēja WP Rocket. Uzziniet vairāk: https://wp-rocket.me -->