Helyi mesterséges intelligencia és automatizálás: útmutató az ügynökökhöz és eszközökhöz

Informatec Digital » Erőforrás » Helyi mesterséges intelligencia és automatizálás: ügynökök, biztonság és valós esetek

A helyi mesterséges intelligencia lehetővé teszi az autonóm ügynökök számára, hogy összetett feladatokat hajtsanak végre a saját hardvereden, miközben megőrzik az adatvédelmet.
Az olyan csomagok, mint az NVIDIA NemoClaw, nyílt modelleket, sandboxingot és részletes eszközvezérlést integrálnak a biztonságos telepítés érdekében.
Az olyan projektek, mint az OpenClaw, a Jan AI, a PocketBot vagy az Ollama+Open WebUI, díjmentesen hozzák el a helyi automatizálást a PC-kre és a mobilokra.
A képernyőképek, hangfelvételek, webes adatgyűjtés és strukturált személyes mappák lehetővé teszik digitális életed nagy részének automatizálását.

La automatizálás helyi mesterséges intelligenciával Ez már nem csak az otthoni szerverekkel rendelkező tech-rajongók számára elérhető, hanem valódi opcióvá válik mindazok számára, akik nagyobb kontrollra, adatvédelemre és rugalmasságra vágynak. Ma már nem függünk teljesen egy nagyvállalat felhőjétől, hogy olyan ügynökök legyenek, akik képesek olvasni a képernyőt, mozgatni az egeret, dolgozni a fájlokkal, vagy összetett munkafolyamatokat futtatni a háttérben.

A helyzet felrobbant: innen teljes értékű rendszerek, mint például az NVIDIA NemoClaw-ja A saját hardvereden futó autonóm ügynököktől kezdve a természetes nyelvet telefonos automatizálássá alakító mobilalkalmazásokon át, mint például a PocketBot, a nyílt platformokig, mint az OpenClaw, az asszisztensekig, mint a Jan AI, és a saját „házi készítésű ChatGPT” beállításához szükséges gyakorlati útmutatókig az Ollama és az Open WebUI segítségével, a cél ugyanaz: egy olyan ökoszisztéma kiépítése, ahol a mesterséges intelligencia a számítógépeden él, interakcióba lép a programjaiddal, és automatizálja a napi feladataidat anélkül, hogy adataidat kivennéd a rendszeredből.

Mi a helyi mesterséges intelligencia általi automatizálás, és miért fontos?

Amikor beszélünk Helyi mesterséges intelligencia az automatizáláshozOlyan modellekre és ügynökökre gondolunk, amelyek a saját eszközödön (PC, szerver, DGX, mobil) futnak anélkül, hogy érzékeny adatokat küldenének külső szerverekre. A modell döntéseket hoz, kódot hajt végre, fájlokat olvas, API-kat hív meg és eszközöket koordinál, de minden a te ellenőrzött környezetedben történik.

A fejlődés drámai volt: az egyszerű, csak kérdésekre válaszoló chatbotoktól eljutottunk oda, hogy Feladatláncok végrehajtására képes mesterséges intelligencia ágensektöbb lépés összehangolására, különböző adatforrások konzultálására és autonóm döntések meghozatalára. Ez teljesen megváltoztatta az automatizálásról alkotott képünket: a modell már nem csak arról szól, hogy „az, aki válaszol”, hanem arról is, hogy „az, aki cselekszik”.

Ennek a változásnak egy nyilvánvaló következménye van: A nagyobb autonómia nagyobb kockázattal járHa hozzáférést adsz egy ügynöknek a fájlrendszerhez, a hitelesítő adataidhoz, a böngésződhöz vagy a fejlesztőeszközeidhez, akkor robusztus biztonsági tervezésre van szükséged. Itt mutatkoznak meg a helyi megközelítések, mivel korlátozhatod az engedélyeket, elkülönítheted a folyamatokat, és szorosan figyelemmel kísérheted, hogy a modell mit csinál egy adott időpontban.

Ezen túlmenően, nyílt modellek ingyenes licencekkel, mint például az Apache-2.0 vagy az MIT (Sok más Falcon, Bark, Jan stb. megoldáshoz hasonlóan ezek is lehetővé teszik megoldások építését szerződések vagy átláthatatlan használati szabályzatok nélkül. Auditálhatja a kódot, módosíthatja a modellt, finomhangolhatja, sőt integrálhatja azt bizonyos hardverekkel, például A100 GPU-kkal vagy NVIDIA DGX munkaállomásokkal.

Számos ágazatban (egészségügy, banki szolgáltatások, jog, közigazgatás), ahol a Adatvédelem és biztonságos tárolás Szent, a következők kombinációja Helyi mesterséges intelligencia + autonóm ágensek + nyílt modellek Ez különbséget jelent: automatizálsz, de az adatok nem hagyják el a határaidat.

Helyi mesterséges intelligencia platformok a fejlett automatizáláshoz: NemoClaw, OpenShell és OpenClaw

Az NVIDIA erőteljesen beszállt ebbe a játékba NemoClawEz egy nyílt forráskódú rendszer, amelyet úgy terveztek, hogy biztonságosan telepíthessen helyi autonóm ügynököket, és biztosítsa azok folyamatos bekapcsoltságát. Úgy tervezték, hogy nagy teljesítményű gépeken, például az NVIDIA DGX Sparkon fusson, de a filozófia más tanúsított környezetekre is alkalmazható.

NemoClaw úgy viselkedik, mint zenekari lét: telepíti és koordinálja az OpenShell-t (a biztonsági futtatókörnyezetet) és az OpenClaw-t (a többcsatornás ügynöki keretrendszert), konfigurálja a modellkövetkeztetést (Ollama vagy NVIDIA NIM segítségével), és a biztonsági szabályzatokat a kezdetektől alkalmazza, nem pedig az utolsó pillanatban kidolgozott javításként.

A verem középpontjában általában NVIDIA Nemotron 3 Super 120BEgy 120.000 milliárd paraméterrel rendelkező, ágensekre optimalizált modell: nagyon jó az összetett utasítások követésében, az eszközök kezelésében és a többlépéses gondolkodásban. Azonban egy ekkora méretű futtatásához komoly GPU-ra és sok memóriára van szükség; csak a modellhez körülbelül 87 GB-ot említenek.

A következtetést általában a következővel szolgálják ki: Ollama, mint helyi futási környezetamely egy REST API-t tesz elérhetővé magán a gépen. A NemoClaw ezzel az API-val kommunikál, hogy promptokat küldjön, válaszokat fogadjon, és koordinálja az eszközhívásokat az eszközhívási minta használatával.

Az alkatrész Az OpenShell kulcsfontosságú a biztonsági szempontbólKikényszeríti a sandboxingot, felügyeli a hitelesítő adatokat, hálózati proxyként működik, és a minimális jogosultságok elvét alkalmazza. Figyelemmel kíséri az ügynök által megkísérelt kapcsolatokat, és lehetővé teszi a végpontok jóváhagyását vagy blokkolását egy TUI-szerű felületről. Így, ha a modell megpróbál hozzáférni egy új szolgáltatáshoz, semmi sem történik a jóváhagyásod nélkül.

A homokozóban él OpenClaw, a többcsatornás ügynöki rétegKezeli a kommunikációt olyan platformokkal, mint a Telegram, a Slack és a Discord, kezeli az ügynök memóriáját, eszközöket (szkripteket, API-kat, böngészőket) csatlakoztat, és hosszú távon fenntartja a beszélgetést. Ha egy mindig aktív asszisztenst szeretnél, amely üzenetküldésen keresztül érhető el, és perzisztens memóriával rendelkezik, akkor ez a komponens teszi ezt lehetővé.

Biztonság, sandboxing és helyi telepítés lépésről lépésre

Ennek a stacknek az egyik nagy erőssége, hogy A biztonságot már a tervezési szakaszban figyelembe vesziknem adják hozzá később. Az ágensprojektek tipikus hibája, hogy először felépítik az összes funkciót, majd megpróbálják „megvédeni” a már megépítetteket, mindenhol lyukakat hozva létre.

Naplóelemzés: teljes körű útmutató az informatika, a biztonság és a SEO számára

A központi mechanizmus a végrehajtási sandboxingAz ügynök által végrehajtani kívánt összes kód izolált környezetben fut: nincs közvetlen hozzáférése a gazdagép fájlrendszeréhez, nem kezdeményezhet tetszőleges hálózati hívásokat, és nem eszkalálhatja a jogosultságokat a konfigurációban meghatározottakon túl.

Ez nagymértékben enyhíti a hatását azonnali injekciós támadások vagy rosszindulatú utasításokat. Ha a modell úgy dönt, hogy valami szokatlant tesz, a kár a sandboxon belül marad. Ennek ellenére maga az NVIDIA is elismeri, hogy egyetlen sandbox sem tökéletes, ezért azt javasolják, hogy az új eszközöket mindig elszigetelt rendszereken teszteljék.

Ezenkívül a NemoClaw a következőket is alkalmazza: eszközök és szabályzatok valós idejű, részletes vezérléseAlapértelmezés szerint az ügynök csak korlátozott számú hálózati végponttal tud kommunikálni. Amikor valami újat próbál megtenni, az OpenShell blokkolja, és pontosan láthatja, hogy mit próbál tenni (hoszt, port, folyamat). Ezután jóváhagyhatja az adott munkamenetre, vagy állandó szabályzatot adhat hozzá a hoszthoz.

A DGX Spark telepítési folyamata jellemzően a következő lépéseket követi: konfigurálás Ubuntu 24.04 LTS NVIDIA illesztőprogramokkal egy számítógép összeszerelési útmutatóTelepítsd a Docker 28.xo vagy újabb verzióját GPU futtatókörnyezettel, telepítsd az Ollama programot és töltsd le a Nemotron 3 Super 120B modellt, végül indítsd el a NemoClaw telepítését egyetlen paranccsal, amely elindít egy konfigurációs varázslót.

Ez a bevezető útmutató végigvezeti Önt tesztkörnyezet neve, következtetési szolgáltató, kiválasztott modell, biztonsági előbeállítások És ha szeretnéd, Telegram integráció is elérhető. Az aktív beállítási idő becsült értéke 20-30 perc, plusz további 15-30 perc a sablon letöltéséhez, a sávszélességtől függően.

A teljesítmény tekintetében realisztikusnak kell lennünk: egy 120B paraméteres modellel a válaszidő a következő idők között mozoghat: 30 és 90 másodperc helyi kontextusban. Ez önmagában nem probléma, de figyelembe kell venni a használati folyamatok és az ügynökhöz rendelt feladatok típusának tervezésekor.

Távoli hozzáférés, webes felület és helyi mesterséges intelligenciához tervezett hardver

Miután minden be van állítva, többféleképpen is kapcsolatba léphet az ügynökkel. A leggyakoribb a Telegramon keresztülEgy @BotFather segítségével létrehozott bot használata praktikus választás: robusztus API, titkosítás, alkalmazások minden típusú eszközhöz, és nem kell a szerverportokat a külvilágnak elérhetővé tenni.

A bot fogadja az üzeneteidet, továbbítja azokat a DGX-en lévő ügynöknek, és választ küld neked. Az érdekes az, hogy bár a beszélgetés a Telegram infrastruktúráján keresztül zajlik, A bizalmas adatokhoz való következtetés és hozzáférés 100%-ban lokális marad a gépeden.

Ezenkívül a NemoClaw kínálja egy privát webes felület Egy tokenizált URL-en keresztül érhető el, amelyet csak egyszer generál a rendszer a bevezetés végén. Rendkívül fontos, hogy ezt az URL-t azonnal mentse, mivel nem fog újra megjelenni. Ha a hálózaton lévő másik gépről szeretné megtekinteni, konfigurálnia kell egy SSH alagutat és porttovábbítást az OpenShell használatával.

Egy apró, de fontos részlet, hogy az URL-t a következővel kell megnyitni: 127.0.0.1 a localhost helyettA localhost használata jogosulatlan eredetű (CORS) hibákat okozhat, amelyek időpocsékolhatják az idődet, ha nem vagy tudatában.

A napi működéshez számos hasznos CLI parancsok: megnyithat egy shellt a sandboxon belül, megtekintheti az állapotot, valós időben követheti a naplókat, listázhatja a sandboxokat, elindíthatja vagy leállíthatja a Telegram hidat, aktiválhatja a porttovábbítást, vagy futtathat egy tiszta eltávolító szkriptet, amely eltávolítja a teljes veremet.

Ami a hardvert illeti, NVIDIA DGX Spark Egyértelműen ilyen felhasználási esetekre tervezték. Kompakt rendszer NVIDIA GPU-kkal és nagy sávszélességű egységes memóriával, ideális közepes és nagy méretű modellek alacsony késleltetésű futtatásához anélkül, hogy egy teljes adatközpontot kellene felállítani.

La egységes memória Különösen az egyik klasszikus szűk keresztmetszetnél segít: az adatok mozgatásakor a CPU és a GPU között. A memória megosztásával a modell sokkal hatékonyabban fér hozzá az adatokhoz, lehetővé téve a több tízmilliárd paraméterrel rendelkező modellek (szinte) valós idejű betöltését – ami a közelmúltig elképzelhetetlen volt a fogyasztói hardverekben.

Népszerű helyi MI-ügynökök: példák és használati esetek

Az NVIDIA ökoszisztémán túl számos más MI-ügynökök és automatizálás-orientált platformok a saját csapatodban amelyeket érdemes ismerni. Mindegyik más típusú felhasználót és más feladatkészletet céloz meg.

Az OpenClaw például népszerűvé vált nyílt forráskódú ügynökplatform amely személyi asszisztensként működik. Lehetővé teszi egyéni ügynökök létrehozását a beérkező levelek mappájának tisztításához, üzenetek küldéséhez, naptár kezeléséhez, utazások szervezéséhez vagy ismétlődő feladatok automatizálásához a digitális életben.

Beépíthető Windows, macOS és LinuxÚgy tervezték, hogy lokálisan is működjön az LLM modellekkel, ami javítja az adatvédelmet és csökkenti a felhőalapú szolgáltatásoktól való függőséget. Továbbá integrálódik olyan üzenetküldő alkalmazásokkal, mint a WhatsApp, Telegram, Discord, Slack, Signal és Apple Messages, így az ügynököd a már használt csevegések „színfalai mögött” futhat.

Bővítményeken keresztül hozzáférést adhatsz neki a böngészőhöz, a közösségi hálózatokhoz, az e-mail kliensekhez és más alkalmazásokhoz, valamint engedélyezheted számára a következőket: kommunikál a fájlrendszerrel, parancsokat és szkripteket futtatvagy automatizálja a tipikus irodai és termelékenységi feladatokat. Mindezt úgy, hogy a felhasználó maga választhatja ki, mely mappák, alkalmazások és szolgáltatások érhetők el az ügynök számára.

Janus Pro: A DeepSeek AI modellje forradalmasítja a képalkotást

Az általánosabb ökoszisztémában olyan platformok, mint a Perplexity számítógépEz a Perplexity-t egy egyszerű társalgási keresőmotorból egy összetett munkafolyamatok végrehajtására képes asszisztenssé alakítja. Ez a Számítógépes mód lehetővé teszi a webböngészést, dokumentumok létrehozását és kezelését, kódírást, adatfeldolgozást, valamint olyan szolgáltatásokkal való koordinációt, mint a Gmail, a Slack, a GitHub és a Notion.

Erőssége abban rejlik, hogy olyan modelleket használ, mint a Claude, a GPT, a Gemini vagy a Perplexity saját Sonar modellje, amelyekkel nagy mennyiségű adatot kezel, és összetett feladatokat oszt fel részfeladatokra, amelyek sorosan vagy párhuzamosan végrehajthatók. Bár nem mindig teljesen lokális, az ügynökminta és az eszközökkel való integráció nagyon hasonló a gépen futó ügynökökhöz.

A tisztán nyílt forráskódú és lokális környezetben, Jan AI A ChatGPT helyettesítőjeként jelenik meg, amely Windows, Mac és Linux rendszerekre telepíthető. Lehetővé teszi helyi modellek, például Llama (Meta) vagy Gemma (Google) használatát, vagy online modellekhez, például ChatGPT, Claude, Gemini, Mistral, Qwen vagy DeepSeek csatlakozást, ha ezek keverékére vágysz.

Jan AI működik egyszerre klasszikus társalgási asszisztens (kérdés, vázlat, összefoglalás, fordítás, átírás, magyarázat) olyan ügynökként, amely képes fájlok és dokumentumok feldolgozására, parancsok végrehajtására és kód generálására különböző nyelveken. Továbbá, a testreszabhatóságra összpontosítva könnyedén létrehozhatja saját ügynökét konkrét utasításokkal, és válthat a különböző „profilok” között attól függően, hogy mit csinál.

Eszközön lévő ügynökök: PocketBot és mobil automatizálás

A koncepció a A helyi mesterséges intelligencia nem marad a számítógépenEz erős hatással van a mobiltelefonokra is, ahol egyre több projekt választja a kicsi, de speciális modelleket, hogy automatizálja a telefont anélkül, hogy a felhőn keresztül kellene működnie.

Jól példázza a PocketBot, egy közvetlenül a következőn futó ügynökprogram: iPhone a flame.cpp használatával MetalonKüldetése, hogy a természetes nyelvet telefonos automatizálássá alakítsa: ahelyett, hogy ezernyi menüben vagy parancsikonon kellene végigpörgetni a felhasználói élményt, leírja, mit szeretne, az ügynök pedig gondoskodik arról, hogy azt cselekvéssé alakítsa.

A PocketBot egy kvantált modellt használ 3.000 milliárd paraméterTeljesen helyben fut, külső szerverekre küldés nélkül. Az iPhone 15 Pro készüléken általában 3-4 GB rendelkezésre álló memória áll rendelkezésre, mielőtt az iOS megkezdené a folyamatok leállítását, így a modell mérete és a kvantálás kritikus fontosságú.

Az alkotók által említett kihívások egyike az, hogy megtalálják Megbízható kis modellek szerszámhívásokhoz és strukturált kimenetekhez JSON-ban. A Qwen3 használatával például olyan problémákba ütköznek, mint a kitalált paraméternevek, a rosszul formázott JSON (hiányzó zárójelek) és az inkonzisztens séma-betartás, ami önkorrekciós és újrapróbálkozási rétegek megvalósítását kényszeríti ki.

Sok vita folyik arról is, hogy optimális kvantálási pont A legjobb minőség/memória arány eléréséhez érdemes olyan opciókat választani, mint a q4_K_M vagy a q5_K_S, a chipgenerációtól és a rendelkezésre álló memóriától függően. Minden egyes kevesebb bit a kvantálásban kezelhetőbb modelleket jelent, de negatívan befolyásolhatja az eszközhívások logikáját és pontosságát.

Egy másik szempont a kiigazítás mintavételi paraméterek a feladattól függően. A tipikus konfigurációk közé tartozik a 0,7-es hőmérséklet, a 0,8-as top_p, a 20-as top_k és az 1,1-es repeat_penalty, de érdekes a szabad párbeszéd és az eszközhívás generálási stratégiáinak szétválasztása, ahol a nagyobb determinizmus és a kevesebb kreativitás érdekes.

Végül, a mobiltelefonon kontextuskezelés Különösen kényes: a rendszerparancs általában a KV gyorsítótárában tárolódik, hogy elkerülje az újrafeldolgozását, és csúszó ablakokat használnak a kapacitás túllépésének elkerülése érdekében; ezért hasznos tudni, hogyan. mentse el és rendszerezze az utasításait.

Ezen túlmenően lehetőség van fokozatos összefoglaló trükkökre, szelektív emlékezésre vagy hibrid sémákra, amelyek a tömörített előzményeket és a közvetlen kontextust kombinálják.

Állítsd be saját „helyi ChatGPT-det” Ollama és Open WebUI segítségével

Azoknak, akiknek nincs szükségük egy olyan komplex stackre, mint a NemoClaw, de mégis szeretnék egy ChatGPT típusú asszisztens, amely a számítógépén futEgy Ollama és az Open WebUI alapú, nagyon praktikus megközelítés vált népszerűvé.

Az ötlet egyszerű: Ollama Felelős a modellek letöltéséért és kiszolgálásáért. (Llama, Gemma, Qwen stb.) a gépeden egy helyi API-n keresztül, az Open WebUI pedig egy a ChatGPT-hez nagyon hasonló webes felületet kínál, de teljes egészében a gépeden fut. A felhasználói felület és a modell közötti összes forgalom a localhoston keresztül zajlik.

Egy nagyon egyszerű, lépésről lépésre szóló útmutató néhány apró trükkel részletesen bemutatja, hogyan 15 terminálparancsEz a beállítás kevesebb mint egy óra alatt beállítható és futtatható. Tartalmazza a Python 3.11 telepítését, az alapvető rendszerkonfigurációt, az Ollama telepítését és az Open WebUI üzembe helyezését, valamint képernyőképeket és hibaelhárítási tippeket.

Az eredmény egy olyan környezet, ahol jól érzed magad nulla költségű előfizetésekTeljes adatvédelem (az adatok soha nem hagyják el a számítógépedet), versenyképes válaszidők (nincsenek megosztott szervereken várakozó sorok), és teljes szabadság a specializált asszisztensek testreszabására a saját igényeid szerint.

Ezenkívül az Open WebUI olyan fejlett funkciókat integrál, mint a Webes keresés, kódértelmező, egyéni modell létrehozása Meghatározott konfigurációk alapján fejlett RAG-képességeket készít elő személyes tudásbázisok kiépítéséhez. Az ötlet az, hogy legyen egy képzett „másodpilótád”, aki ismeri a dokumentumaidat és a munkafolyamataidat anélkül, hogy harmadik félre kellene támaszkodnod.

SELinux biztonság: Irányítsd Linux rendszeredet milliméter pontossággal

Néhány hónapnyi használat után sok felhasználó arról számolt be, hogy ez a kombináció teljesen felváltotta [az előző terméket/szolgáltatást]. fizetős előfizetéseik felhőalapú megoldásokramiközben javítják az integrációt a saját helyi adataikkal és eszközeikkel. A következő természetes lépés az, hogy ezt a „házi készítésű ChatGPT”-t összekapcsolják ügynökökkel, szkriptekkel és szolgáltatásokkal az összetettebb automatizálások koordinálása érdekében.

Automatizálja digitális életét: gyakorlati példák helyi mesterséges intelligenciával

Mindez technikai szinten nagyszerűen hangzik, de mit lehet vele kezdeni a mindennapi életben? jól képzett helyi ügynökökA lehetőségek meglehetősen széleskörűek, ha kombináljuk a multimodális modelleket, a képernyőhozzáférést, az eszközöket és a strukturált tárolást.

Vannak olyan javaslatok, amelyek célja automatizálja saját számítógépének használatát olyan ügynökökkel, akik képernyőképeket fogadnak és azokon cselekszenek. A folyamat nagyjából így nézne ki: a rendszer képernyőképet készít, az ügynök feldolgozza azt egy képekkel dolgozni képes modellel, megérti, hogy melyik alkalmazás van megnyitva, milyen gombok vannak jelen, milyen szöveg jelenik meg, és a prompt alapján eldönti, hogy mit tegyen.

Ezzel az ötlettel például megtehetnéd, specializált fordítóügynökségek felállításaA rendszer rögzíti a képernyő lefordítani kívánt részét, kinagyítja egy „nagyítóüveg-fordító” ablakban, és szinte azonnali fordítást generál egy apró modell (pl. 4B paraméterek) segítségével, amelyet finomhangoltak a fordításhoz, mint például a PHI finomhangolt változata.

Egy másik érdekes front az, hogy Vizuális modellek, amelyek képernyőképeket PDF-ekké alakítanakKépzeljen el egy olyan eszközt, amely prezentációk, műszerfalak vagy dokumentumok képernyőképeiből jól formázott PDF fájlokat generál, amelyeket aztán finomíthat vagy közvetlenül felhasználhat a prezentációiban. A Python és az Acrobat integrálásával automatizálhatja a teljes folyamatot.

Ahhoz, hogy külső szolgáltatásoktól függetlenül lehessen dolgozni az interneten, olyan veterán technológiákra van szükség, mint például A BeautifulSoup továbbra is nagyon hasznosBeállíthat egy könnyűsúlyú HTML-kaparót, amely több oldalt is feltérképez, és csak a szükséges HTML-t tárolja (például csak a , p, h1, h2, h3), és csak a szűrt szöveget adjuk át a modellnek. Ez csökkenti a zajt, teljes kontrollt biztosít a mesterséges intelligencia által látottak felett, és kiküszöböli a harmadik féltől származó API-któl való függőséget. Ha az ügynök hozzáfér a kurzorhoz és a videószerkesztő eszközökhöz is, az megnyitja az utat a feladatok automatizálása előtt olyan programokban, mint a DaVinci Resolve vagy az Adobe After Effects. Az ügynök összehasonlítja az utolsó képernyőképet a következővel, megállapítja, hová kell helyeznie az egeret, és milyen műveletet kell végrehajtania a kért eredmény eléréséhez. Hanganyagok tekintetében integrálhatsz egy hangalapú rendszert emberi értékeléssel : az ügynök generál egy mondatot (például: "Jó reggelt, szerelmem"), te 1-től 10-ig pontozod, és eldöntöd, hogy mented-e. Ez a besorolás felhasználható olyan paraméterek beállítására, mint például a generációs hőmérséklet, vagy manuálisan is szabályozható egy erre a célra szolgáló ablakból. A hangalámondások {phrase}-{number}.mp3 vagy .wav fájlokba mentésével a hangokat újra felhasználhatja és újrakombinálhatja a jövőbeli munkamenetekben. Az olyan modellek, mint a Bark, melyeket az MIT licencelt, nagyon jól alkalmazkodnak ehhez a szinte végtelen testreszabhatósághoz, sőt, ahol értelmes, érzelmi árnyalatokat is hozzáadnak. Az összes információ rendszerezéséhez elengedhetetlen, hogy az ügynök számára egy strukturált személyes mappát biztosítsunk a gépünkön: user-info/, search-data/, screenshots/, screenshots-for-translate/, voices/, lang/, code-spaces/… A kód GitHub-ra való feltöltése helyett helyileg is menthetjük a projekteket , és kiválaszthatjuk, hogy az ügynök mely adattárakat vagy mappákat használja kontextusként az egyes munkamenetekben. Végül, ha azt szeretné, hogy a modell egy bizonyos ideig alkalmazkodjon Önhöz, felfedezhet olyan finomhangolási technikákat, mint a LoRA vagy a QLoRA . Ezek a megközelítések lehetővé teszik, hogy a modellt a stílusodhoz vagy a területedhez igazítsd anélkül, hogy mindent a nulláról kellene újratanítanod, bár olyan környezetekben, ahol a tiszta termelékenység a legfontosabb, nem biztos, hogy érdemes mindig aktívan tartani; ideális esetben képesnek kell lenned aktiválni vagy inaktiválni ezt a testreszabást. Ebben az összefüggésben az alapmodell megválasztása is fontossá válik: sok fejlesztő Apache-2.0 vagy MIT modelleket keres, mind kis méretben (2-4B paraméter) prototípusokhoz és szerényebb eszközökhöz, mind 30B-s modellekben, amelyeket csúcskategóriás hardverekkel (pl. A100 GPU-kkal) tanítottak be a nagyméretű finomhangoláshoz. Becslések szerint néhány hónapnyi komoly munka ezen a területen nagyon versenyképes eredményeket hozhat. Az egész ökoszisztémát tekintve a helyszíni mesterséges intelligencia automatizálása a kísérleti állapotból egy szilárd infrastruktúrává válik , mind az egyéni felhasználók számára, akik megelégedtek a havi díjakkal, mind a vállalatok számára, amelyek nem engedhetik meg maguknak, hogy érzékeny adatokat vigyenek ki a telephelyükről. Desde stacks listos para producción como NemoClaw hasta configuraciones caseras con Ollama y Open WebUI, pasando por agentes de escritorio y móviles como OpenClaw, Jan AI o PocketBot, el denominador común es el mismo: más control, más privacidad y una autonomía de la IA que, por primera vez, puedes gobernar tú.</p> <div class="post-relacionado-wrapper"><a href="https://informatecdigital.com/microsoft-mu-la-nueva-ia-local-que-revoluciona-la-configuracion-en-windows-11/?utm_source=destacado-inside" class="post-relacionado"><picture fetchpriority="high" decoding="async" class="attachment-medium size-medium wp-post-image"> <source type="image/webp" data-lazy-srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg.webp 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg.webp 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg.webp 1200w" sizes="(max-width: 400px) 100vw, 400px"/> <img fetchpriority="high" decoding="async" width="400" height="225" src="data:image/svg+xml,%3Csvg%20xmlns='http://www.w3.org/2000/svg'%20viewBox='0%200%20400%20225'%3E%3C/svg%3E" alt="microsoft mu ia-0" data-lazy-srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg 1200w" data-lazy-sizes="(max-width: 400px) 100vw, 400px" data-lazy-src="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg"/><noscript><img fetchpriority="high" decoding="async" width="400" height="225" src="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg" alt="microsoft mu ia-0" srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg 1200w" sizes="(max-width: 400px) 100vw, 400px"/></noscript> </picture> <div><div>Related article:</div><div class="post-relacionado-title">Microsoft Mu: la nueva IA local que revoluciona la configuración en Windows 11</div></div></a></div> <div id="toc_container" class="no_bullets"><p class="toc_title">Tabla de Contenidos</p><ul class="toc_list"><li><a href="#Que_es_la_automatizacion_con_IA_local_y_por_que_importa">Qué es la automatización con IA local y por qué importa</a></li><li><a href="#Stacks_de_IA_local_para_automatizacion_avanzada_NemoClaw_OpenShell_y_OpenClaw">Stacks de IA local para automatización avanzada: NemoClaw, OpenShell y OpenClaw</a></li><li><a href="#Seguridad_sandboxing_y_despliegue_local_paso_a_paso">Seguridad, sandboxing y despliegue local paso a paso</a></li><li><a href="#Acceso_remoto_interfaz_web_y_hardware_pensado_para_IA_local">Acceso remoto, interfaz web y hardware pensado para IA local</a></li><li><a href="#Agentes_de_IA_locales_populares_ejemplos_y_casos_de_uso">Agentes de IA locales populares: ejemplos y casos de uso</a></li><li><a href="#Agentes_en_el_dispositivo_PocketBot_y_automatizacion_en_el_movil">Agentes en el dispositivo: PocketBot y automatización en el móvil</a></li><li><a href="#Montar_tu_propio_ChatGPT_local_con_Ollama_y_Open_WebUI">Montar tu propio “ChatGPT local” con Ollama y Open WebUI</a></li><li><a href="#Automatizar_tu_vida_digital_ejemplos_practicos_con_IA_local">Automatizar tu vida digital: ejemplos prácticos con IA local</a></li></ul></div> </div> <footer class="entry-meta" aria-label="Meta de entradas"> <span class="cat-links"><span class="gp-icon icon-categories"><svg viewBox="0 0 512 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em"><path d="M0 112c0-26.51 21.49-48 48-48h110.014a48 48 0 0143.592 27.907l12.349 26.791A16 16 0 00228.486 128H464c26.51 0 48 21.49 48 48v224c0 26.51-21.49 48-48 48H48c-26.51 0-48-21.49-48-48V112z" /></svg></span><span class="screen-reader-text">Categorías </span><a href="https://informatecdigital.com/inteligencia-artificial/" rel="category tag">Inteligencia Artificial</a>, <a href="https://informatecdigital.com/seguridad/" rel="category tag">Seguridad</a></span> <nav id="nav-below" class="post-navigation" aria-label="Entradas"> <div class="nav-previous"><span class="gp-icon icon-arrow-left"><svg viewBox="0 0 192 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em" fill-rule="evenodd" clip-rule="evenodd" stroke-linejoin="round" stroke-miterlimit="1.414"><path d="M178.425 138.212c0 2.265-1.133 4.813-2.832 6.512L64.276 256.001l111.317 111.277c1.7 1.7 2.832 4.247 2.832 6.513 0 2.265-1.133 4.813-2.832 6.512L161.43 394.46c-1.7 1.7-4.249 2.832-6.514 2.832-2.266 0-4.816-1.133-6.515-2.832L16.407 262.514c-1.699-1.7-2.832-4.248-2.832-6.513 0-2.265 1.133-4.813 2.832-6.512l131.994-131.947c1.7-1.699 4.249-2.831 6.515-2.831 2.265 0 4.815 1.132 6.514 2.831l14.163 14.157c1.7 1.7 2.832 3.965 2.832 6.513z" fill-rule="nonzero" /></svg></span><span class="prev"><a href="https://informatecdigital.com/personalidad-en-smart-home-del-hogar-conectado-al-hogar-que-te-entiende/" rel="prev">Personalidad en smart home: del hogar conectado al hogar que te entiende</a></span></div> </nav> </footer> </div> </article> </main> </div> <div data-rocket-location-hash="0b9fe17c76c2e58ac880f2c41872dd87" class="widget-area sidebar is-right-sidebar" id="right-sidebar"> <div class="inside-right-sidebar"> </div> </div> </div> </div> <div class="no-wpr-lazyrender site-footer"> <footer class="gb-container gb-container-925a2a1e"> <div class="gb-container gb-container-cbee1dca"> <div class="gb-grid-wrapper gb-grid-wrapper-51f71b20"> <div class="gb-grid-column gb-grid-column-4f4cf5cf"><div class="gb-container gb-container-4f4cf5cf"> <h2 class="gb-headline gb-headline-5c3b3482 gb-headline-text">Informática y Tecnología Digital</h2> <p class="gb-headline gb-headline-e29c0825 gb-headline-text">En <strong>InformaTecDigital</strong> nos dedicamos a proporcionarte las noticias más recientes y sugerencias efectivas, para que estés siempre al día y bien informado. Nuestro objetivo es ser tu socio de confianza en este emocionante recorrido tecnológico, haciendo más fácil tu experiencia con cada nuevo descubrimiento.</p> </div></div> <div class="gb-grid-column gb-grid-column-04e24954"><div class="gb-container gb-container-04e24954"> <h2 class="gb-headline gb-headline-3e937023 gb-headline-text">Categorías</h2> <p class="gb-headline gb-headline-3f1b1c14 gb-headline-text"><a href="https://informatecdigital.com/tecnologia/">Tecnología</a></p> <p class="gb-headline gb-headline-6500416f gb-headline-text"><a href="https://informatecdigital.com/inteligencia-artificial/">Inteligencia Artificial</a></p> <p class="gb-headline gb-headline-86bfcc6a gb-headline-text"><a href="https://informatecdigital.com/programacion/">Programación</a></p> <p class="gb-headline gb-headline-f9d791fe gb-headline-text"><a href="https://informatecdigital.com/algoritmos/">Algoritmos</a></p> <p class="gb-headline gb-headline-1d5a060c gb-headline-text"><a href="https://informatecdigital.com/informatica/">Informática</a></p> <p class="gb-headline gb-headline-ebbabf05 gb-headline-text"><a href="https://informatecdigital.com/internet/">Internet</a></p> </div></div> <div class="gb-grid-column gb-grid-column-1d8f8f12"><div class="gb-container gb-container-1d8f8f12"> <h2 class="gb-headline gb-headline-529b3704 gb-headline-text">síguenos</h2> <div class="gb-container gb-container-8d3b0714"> <a class="gb-button gb-button-8a872c76" href="https://x.com/informatecd" target="_blank" rel="noopener noreferrer" aria-label="Follow Us on Twitter"><span class="gb-icon"><svg aria-hidden="true" role="img" height="1em" width="1em" viewBox="0 0 512 512" xmlns="http://www.w3.org/2000/svg"><path fill="currentColor" d="M389.2 48h70.6L305.6 224.2 487 464H345L233.7 318.6 106.5 464H35.8L200.7 275.5 26.8 48H172.4L272.9 180.9 389.2 48zM364.4 421.8h39.1L151.1 88h-42L364.4 421.8z"></path></svg></span></a> </div> </div></div> </div> <div class="gb-container gb-container-68b619a0"> <p class="gb-headline gb-headline-368a465b gb-headline-text">© 2026 InformaTecDigital</p> <div class="gb-container gb-container-26043e29"> <p class="gb-headline gb-headline-fcb53bf6 gb-headline-text"><a href="https://informatecdigital.com/quienes-somos/">Quienes Somos</a></p> <p class="gb-headline gb-headline-e38f9197 gb-headline-text"><a href="https://informatecdigital.com/aviso-legal/" data-type="page" data-id="24">Aviso Legal</a></p> <p class="gb-headline gb-headline-f9af17bf gb-headline-text"><a href="https://informatecdigital.com/formulario-de-contacto/">Contacto</a></p> </div> </div> </div> </footer> <p></p> </div> <script type="speculationrules"> {"prefetch":[{"source":"document","where":{"and":[{"href_matches":"/*"},{"not":{"href_matches":["/wp-*.php","/wp-admin/*","/wp-content/uploads/*","/wp-content/*","/wp-content/plugins/*","/wp-content/themes/abn-generatepress-adsense/*","/wp-content/themes/generatepress/*","/*\\?(.+)"]}},{"not":{"selector_matches":"a[rel~=\"nofollow\"]"}},{"not":{"selector_matches":".no-prefetch, .no-prefetch a"}}]},"eagerness":"conservative"}]} </script> <script type="text/rocketlazyloadscript" id="generate-a11y"> !function(){"use strict";if("querySelector"in document&&"addEventListener"in window){var e=document.body;e.addEventListener("pointerdown",(function(){e.classList.add("using-mouse")}),{passive:!0}),e.addEventListener("keydown",(function(){e.classList.remove("using-mouse")}),{passive:!0})}}(); </script> <div data-rocket-location-hash="9089b6fff3545f5f3220e195bce56095" class="gp-modal gp-search-modal" id="gp-search" role="dialog" aria-modal="true" aria-label="Buscar"> <div data-rocket-location-hash="e7419566db319650b22985a79bd613d4" class="gp-modal__overlay" tabindex="-1" data-gpmodal-close> <div data-rocket-location-hash="17238aeffc6392939f4952b095835f70" class="gp-modal__container"> <form role="search" method="get" class="search-modal-form" action="https://informatecdigital.com/"> <label for="search-modal-input" class="screen-reader-text">Buscar:</label> <div class="search-modal-fields"> <input id="search-modal-input" type="search" class="search-field" placeholder="Buscar..." value="" name="s" /> <button aria-label="Buscar"><span class="gp-icon icon-search"><svg viewBox="0 0 512 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em"><path fill-rule="evenodd" clip-rule="evenodd" d="M208 48c-88.366 0-160 71.634-160 160s71.634 160 160 160 160-71.634 160-160S296.366 48 208 48zM0 208C0 93.125 93.125 0 208 0s208 93.125 208 208c0 48.741-16.765 93.566-44.843 129.024l133.826 134.018c9.366 9.379 9.355 24.575-.025 33.941-9.379 9.366-24.575 9.355-33.941-.025L337.238 370.987C301.747 399.167 256.839 416 208 416 93.125 416 0 322.875 0 208z" /></svg></span></button> </div> </form> </div> </div> </div> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/plugins/gp-premium/menu-plus/functions/js/sticky.min.js?ver=2.5.5" id="generate-sticky-js" data-rocket-defer defer></script> <script id="toc-front-js-extra"> var tocplus = {"visibility_show":"mostrar","visibility_hide":"ocultar","visibility_hide_by_default":"1","width":"100%"}; //# sourceURL=toc-front-js-extra </script> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/plugins/table-of-contents-plus/front.min.js?ver=2411.1" id="toc-front-js" data-rocket-defer defer></script> <script type="text/rocketlazyloadscript" id="generate-menu-js-before"> var generatepressMenu = {"toggleOpenedSubMenus":true,"openSubMenuLabel":"Abrir el submen\u00fa","closeSubMenuLabel":"Cerrar el submen\u00fa"}; //# sourceURL=generate-menu-js-before </script> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/themes/generatepress/assets/js/menu.min.js?ver=3.6.1" id="generate-menu-js" data-rocket-defer defer></script> <script type="text/rocketlazyloadscript" data-minify="1" data-rocket-src="https://informatecdigital.com/wp-content/cache/min/1/wp-content/themes/generatepress/assets/dist/modal.js?ver=1777299219" id="generate-modal-js" data-rocket-defer defer></script> <script>window.lazyLoadOptions=[{elements_selector:"img[data-lazy-src],.rocket-lazyload",data_src:"lazy-src",data_srcset:"lazy-srcset",data_sizes:"lazy-sizes",class_loading:"lazyloading",class_loaded:"lazyloaded",threshold:300,callback_loaded:function(element){if(element.tagName==="IFRAME"&&element.dataset.rocketLazyload=="fitvidscompatible"){if(element.classList.contains("lazyloaded")){if(typeof window.jQuery!="undefined"){if(jQuery.fn.fitVids){jQuery(element).parent().fitVids()}}}}}},{elements_selector:".rocket-lazyload",data_src:"lazy-src",data_srcset:"lazy-srcset",data_sizes:"lazy-sizes",class_loading:"lazyloading",class_loaded:"lazyloaded",threshold:300,}];window.addEventListener('LazyLoad::Initialized',function(e){var lazyLoadInstance=e.detail.instance;if(window.MutationObserver){var observer=new MutationObserver(function(mutations){var image_count=0;var iframe_count=0;var rocketlazy_count=0;mutations.forEach(function(mutation){for(var i=0;i<mutation.addedNodes.length;i++){if(typeof mutation.addedNodes[i].getElementsByTagName!=='function'){continue} if(typeof mutation.addedNodes[i].getElementsByClassName!=='function'){continue} images=mutation.addedNodes[i].getElementsByTagName('img');is_image=mutation.addedNodes[i].tagName=="IMG";iframes=mutation.addedNodes[i].getElementsByTagName('iframe');is_iframe=mutation.addedNodes[i].tagName=="IFRAME";rocket_lazy=mutation.addedNodes[i].getElementsByClassName('rocket-lazyload');image_count+=images.length;iframe_count+=iframes.length;rocketlazy_count+=rocket_lazy.length;if(is_image){image_count+=1} if(is_iframe){iframe_count+=1}}});if(image_count>0||iframe_count>0||rocketlazy_count>0){lazyLoadInstance.update()}});var b=document.getElementsByTagName("body")[0];var config={childList:!0,subtree:!0};observer.observe(b,config)}},!1)</script><script data-no-minify="1" async src="https://informatecdigital.com/wp-content/plugins/wp-rocket/assets/js/lazyload/17.8.3/lazyload.min.js"></script><script type="text/rocketlazyloadscript"> /** * Des-Re-Valorizador * Código para hackear valoraciones * Quita el contenido de la columna Valoración de la tabla generada * por el plugin AAWP y asigna una valoración aleatoria entre 4, 4.5 y 5 estrellas. * */ let colRatings = document.querySelectorAll( 'td.aawp-table__td-rating' ); colRatings.forEach( col => col.innerHTML = addRating() ); let colRatings2 = document.querySelectorAll( 'span.aawp-product__no-rating' ); colRatings2.forEach( col => col.innerHTML = addRating() ); function addRating() { const ratings = [ 80, 90, 100 ]; const randomRating = ratings[ Math.floor( Math.random() * ratings.length ) ]; return ' '; } var rocket_beacon_data = {"ajax_url":"https:\/\/informatecdigital.com\/wp-admin\/admin-ajax.php","nonce":"44866e9d8e","url":"https:\/\/informatecdigital.com\/ia-local-y-automatizacion-agentes-seguridad-y-casos-reales","is_mobile":false,"width_threshold":1600,"height_threshold":700,"delay":500,"debug":null,"status":{"atf":true,"lrc":true,"preload_fonts":true,"preconnect_external_domain":true},"elements":"img, video, picture, p, main, div, li, svg, section, header, span","lrc_threshold":1800,"preload_fonts_exclusions":["api.fontshare.com","cdn.fontshare.com"],"processed_extensions":["woff2","woff","ttf"],"external_font_exclusions":[],"preconnect_external_domain_elements":["link","script","iframe"],"preconnect_external_domain_exclusions":["informatecdigital.com","com","hreflang","static.cloudflareinsights.com","rel=\"profile\"","rel=\"preconnect\"","rel=\"dns-prefetch\"","rel=\"icon\""]} A teljesítményt a WP Rocket optimalizálja. Tudj meg többet: https://wp-rocket.me -->