Lokalna sztuczna inteligencja i automatyzacja: przewodnik po agentach i narzędziach

Informatec Digital » Zasoby » Lokalna sztuczna inteligencja i automatyzacja: agenci, bezpieczeństwo i przypadki z życia wzięte

Lokalna sztuczna inteligencja umożliwia autonomicznym agentom wykonywanie złożonych zadań na Twoim sprzęcie, przy jednoczesnym zachowaniu prywatności danych.
Rozwiązania takie jak NVIDIA NemoClaw integrują otwarte modele, środowiska testowe i szczegółową kontrolę narzędzi, zapewniając bezpieczne wdrażanie.
Projekty takie jak OpenClaw, Jan AI, PocketBot czy Ollama+Open WebUI pozwalają na korzystanie z lokalnej automatyzacji na komputerach PC i urządzeniach mobilnych bez żadnych opłat.
Zrzuty ekranu, nagrywanie głosu, pozyskiwanie danych ze stron internetowych i uporządkowane foldery osobiste pozwalają zautomatyzować znaczną część Twojego cyfrowego życia.

La automatyzacja z lokalną sztuczną inteligencją Rozwiązanie to nie jest już przeznaczone wyłącznie dla entuzjastów technologii z serwerami domowymi, ale staje się realną opcją dla każdego, kto chce mieć większą kontrolę, prywatność i elastyczność. Dziś nie jesteś już całkowicie zależny od chmury dużej firmy, aby mieć agentów zdolnych do odczytywania ekranu, poruszania myszą, pracy z plikami czy uruchamiania złożonych przepływów pracy w tle.

Sytuacja eksplodowała: od pełne stosy, takie jak NemoClaw firmy NVIDIA Od autonomicznych agentów działających na Twoim własnym sprzęcie po aplikacje mobilne, takie jak PocketBot, które konwertują język naturalny na automatyzację telefoniczną, a także otwarte platformy, takie jak OpenClaw, asystenci, tacy jak Jan AI, oraz praktyczne przewodniki dotyczące konfiguracji własnego „domowego ChatGPT” z Ollama i Open WebUI — cel jest ten sam: zbudowanie ekosystemu, w którym sztuczna inteligencja funkcjonuje na Twoim komputerze, wchodzi w interakcje z Twoimi programami i automatyzuje codzienne zadania bez wyjmowania danych z systemu.

Czym jest lokalna automatyzacja AI i dlaczego jest ważna?

Kiedy mówimy o Lokalna sztuczna inteligencja do automatyzacjiMamy na myśli modele i agentów, które działają na Twoim urządzeniu (komputerze, serwerze, DGX, urządzeniu mobilnym) bez wysyłania poufnych danych na serwery zewnętrzne. Model podejmuje decyzje, wykonuje kod, odczytuje pliki, wywołuje API i koordynuje narzędzia, ale wszystko dzieje się w kontrolowanym przez Ciebie środowisku.

Ewolucja była dramatyczna: od prostych chatbotów, które tylko odpowiadały na pytania, przeszliśmy do Agenci AI zdolni do wykonywania łańcuchów zadańAby organizować wiele kroków, konsultować różne źródła danych i podejmować autonomiczne decyzje. To całkowicie zmieniło nasze rozumienie automatyzacji: model nie jest już tylko „tym, który odpowiada”, ale „tym, który działa”.

Zmiana ta ma jedną oczywistą konsekwencję: Większa autonomia oznacza większe ryzykoJeśli udzielasz agentowi dostępu do systemu plików, swoich danych uwierzytelniających, przeglądarki lub narzędzi programistycznych, potrzebujesz solidnego projektu zabezpieczeń. W tym miejscu sprawdzają się podejścia lokalne, ponieważ pozwalają ograniczyć uprawnienia, odizolować procesy i dokładnie monitorować działania modelu w dowolnym momencie.

Ponadto, otwarte modele z bezpłatnymi licencjami, takimi jak Apache-2.0 lub MIT (Podobnie jak wiele rozwiązań Falcon, Bark, Jan itp.), pozwalają one na tworzenie rozwiązań bez konieczności wiązania się umowami czy nieprzejrzystymi zasadami użytkowania. Można audytować kod, dostosowywać model, stosować precyzyjne dostrajanie, a nawet integrować go z konkretnym sprzętem, takim jak procesory graficzne A100 czy stacje robocze NVIDIA DGX.

W przypadku wielu sektorów (ochrona zdrowia, bankowość, prawo, administracja publiczna), w których Prywatność i bezpieczne przechowywanie To jest święte, połączenie Lokalna sztuczna inteligencja + autonomiczni agenci + otwarte modele To robi różnicę: automatyzujesz, ale dane nie opuszczają Twojego obszaru działania.

Lokalne stosy sztucznej inteligencji do zaawansowanej automatyzacji: NemoClaw, OpenShell i OpenClaw

NVIDIA mocno wkroczyła w tę grę NemoClawTo stos open source zaprojektowany do bezpiecznego, lokalnego wdrażania autonomicznych agentów i zapewnienia ich ciągłej dostępności. Został zaprojektowany do działania na wydajnych maszynach, takich jak NVIDIA DGX Spark, ale filozofia ta ma zastosowanie również w innych certyfikowanych środowiskach.

NemoClaw działa jako capa de orquestación: instaluje i koordynuje OpenShell (środowisko wykonawcze zabezpieczeń) i OpenClaw (wielokanałową platformę agentów), konfiguruje wnioskowanie modelu (za pośrednictwem Ollama lub NVIDIA NIM) i stosuje zasady bezpieczeństwa od samego początku, a nie jako poprawkę w ostatniej chwili.

W sercu stosu znajduje się zazwyczaj NVIDIA Nemotron 3 Super 120BModel ze 120.000 miliardami parametrów zoptymalizowanych pod kątem agentów: bardzo dobry w wykonywaniu złożonych instrukcji, obsłudze narzędzi i rozumowaniu wieloetapowym. Jednak do uruchomienia czegoś tak dużego potrzebna jest wydajna karta graficzna i dużo pamięci; sam model wymaga około 87 GB.

Wnioskowanie jest zwykle podawane z Ollama jako lokalne środowisko wykonawczektóry udostępnia interfejs API REST na samej maszynie. NemoClaw komunikuje się z tym interfejsem API, aby wysyłać monity, odbierać odpowiedzi i koordynować wywołania narzędzi, korzystając ze wzorca wywołania narzędzi.

Składnik OpenShell jest kluczowy w aspekcie bezpieczeństwaWymusza sandboxing, kontroluje uprawnienia, działa jako proxy sieciowe i stosuje zasadę najmniejszych uprawnień. Monitoruje połączenia nawiązywane przez agenta i umożliwia zatwierdzanie lub blokowanie punktów końcowych z poziomu interfejsu podobnego do TUI. W ten sposób, jeśli model spróbuje uzyskać dostęp do nowej usługi, nic nie dzieje się bez Twojej zgody.

W piaskownicy mieszka OpenClaw, wielokanałowa warstwa agentaObsługuje komunikację z platformami takimi jak Telegram, Slack i Discord, zarządza pamięcią agenta, łączy narzędzia (skrypty, API, przeglądarki) i utrzymuje konwersację w dłuższej perspektywie. Jeśli potrzebujesz asystenta zawsze aktywnego, dostępnego za pośrednictwem wiadomości i z trwałą pamięcią, ten komponent to umożliwi.

Bezpieczeństwo, środowisko testowe i wdrażanie lokalne krok po kroku

Jedną z największych zalet tego stosu jest to, że Bezpieczeństwo jest brane pod uwagę już na etapie projektowania.nie dodane później. Typowym błędem w projektach agentów jest najpierw zbudowanie wszystkich funkcjonalności, a następnie próba „zabezpieczenia” tego, co już zostało zbudowane, co prowadzi do powstawania luk wszędzie.

Analiza logów: kompletny przewodnik po IT, bezpieczeństwie i SEO

Centralnym mechanizmem jest piaskownica wykonawczaCały kod, który agent chce wykonać, jest uruchamiany w odizolowanym środowisku: nie ma bezpośredniego dostępu do systemu plików hosta, nie może wykonywać dowolnych wywołań sieciowych i nie może rozszerzać uprawnień poza te zdefiniowane w konfiguracji.

Znacznie łagodzi to wpływ ataki typu instant injection lub złośliwych instrukcji. Jeśli model zdecyduje się na coś nietypowego, szkody pozostają ograniczone do piaskownicy. Mimo to sama firma NVIDIA przyznaje, że żadna piaskownica nie jest idealna, dlatego zaleca zawsze testowanie nowych narzędzi na odizolowanych systemach.

Ponadto NemoClaw wdraża szczegółowa kontrola narzędzi i zasad w czasie rzeczywistymDomyślnie agent może komunikować się tylko z ograniczoną liczbą punktów końcowych sieci. Gdy próbuje wykonać jakąś nową operację, OpenShell ją blokuje, a Ty widzisz dokładnie, co próbuje zrobić (host, port, proces). Możesz następnie zatwierdzić ją dla danej sesji lub dodać stałą politykę na hoście.

Przepływ wdrażania w DGX Spark zwykle przebiega według następujących kroków: konfiguracja Ubuntu 24.04 LTS ze sterownikami NVIDIA po instrukcja montażu komputeraZainstaluj Docker 28.xo lub nowszą wersję z środowiskiem uruchomieniowym GPU, zainstaluj Ollama i pobierz model Nemotron 3 Super 120B, a na koniec uruchom instalację NemoClaw za pomocą jednego polecenia, które uruchomi kreatora konfiguracji.

To szkolenie wprowadzające przeprowadzi Cię przez nazwa piaskownicy, dostawca wnioskowania, wybrany model, ustawienia wstępne zabezpieczeń A jeśli chcesz, możesz skorzystać z integracji z Telegramem. Aktywny czas konfiguracji szacuje się na 20-30 minut, plus kolejne 15-30 minut na pobranie szablonu, w zależności od przepustowości łącza.

Jeśli chodzi o wydajność, musimy być realistami: odpowiedź z modelem parametrów 120B może zająć od 30 i 90 sekund w kontekście lokalnym. Samo w sobie nie stanowi to problemu, ale należy to uwzględnić przy projektowaniu przepływów użytkowania i rodzaju zadań przypisywanych agentowi.

Zdalny dostęp, interfejs internetowy i sprzęt przeznaczony do lokalnej sztucznej inteligencji

Gdy wszystko jest już skonfigurowane, możesz komunikować się z agentem na kilka sposobów. Najczęściej jest to: przez TelegramKorzystanie z bota stworzonego za pomocą @BotFather jest praktycznym wyborem: solidne API, szyfrowanie, aplikacje dla wszystkich typów urządzeń i brak konieczności udostępniania portów serwera światu zewnętrznemu.

Bot odbiera Twoje wiadomości, przekazuje je do agenta na DGX i odsyła Ci odpowiedź. Ciekawostką jest to, że chociaż rozmowa przechodzi przez infrastrukturę Telegrama, Wnioskowanie i dostęp do wrażliwych danych pozostają w 100% lokalne na Twojej maszynie.

Ponadto NemoClaw oferuje prywatny interfejs sieciowy Dostępny za pośrednictwem tokenizowanego adresu URL wygenerowanego tylko raz na koniec procesu onboardingu. Należy natychmiast zapisać ten adres URL, ponieważ nie będzie on ponownie wyświetlany. Aby wyświetlić go z innego komputera w sieci, należy skonfigurować tunel SSH i przekierowanie portów za pomocą OpenShell.

Jednym małym, ale ważnym szczegółem jest to, że adres URL musi zostać otwarty za pomocą 127.0.0.1 zamiast localhostUżycie localhost może spowodować błędy CORS (nieautoryzowanego pochodzenia), które mogą powodować stratę czasu, jeśli nie będziesz o tym wiedzieć.

Do codziennych operacji jest kilka przydatne polecenia CLI: otwórz powłokę w piaskownicy, zobacz status, śledź logi w czasie rzeczywistym, wyświetl listę piaskownic, uruchom lub zatrzymaj most Telegram, aktywuj przekierowanie portów lub uruchom czysty skrypt deinstalacyjny, który usunie cały stos.

Jeśli chodzi o sprzęt, NVIDIA® DGX Spark® Został zaprojektowany z myślą o takich zastosowaniach. To kompaktowy system z procesorami graficznymi NVIDIA i zunifikowaną pamięcią o dużej przepustowości, idealny do obsługi średnich i dużych modeli z niskim opóźnieniem, bez konieczności konfigurowania całego centrum danych.

La zunifikowana pamięć Pomaga to szczególnie w przypadku jednego z klasycznych wąskich gardeł: przesyłania danych między procesorem a kartą graficzną. Dzięki współdzieleniu przestrzeni pamięci model uzyskuje dostęp do danych znacznie wydajniej, umożliwiając ładowanie modeli z dziesiątkami miliardów parametrów w czasie (prawie) rzeczywistym – co do niedawna było nie do pomyślenia w sprzęcie konsumenckim.

Popularni lokalni agenci AI: przykłady i przypadki użycia

Oprócz ekosystemu NVIDIA istnieje wiele innych Agenci AI i platformy zorientowane na automatyzację w Twoim zespole które warto znać. Każdy z nich jest skierowany do innego typu użytkownika i innego zestawu zadań.

Na przykład OpenClaw stał się popularny jako platforma agentów open source który działa jak osobisty asystent. Umożliwia tworzenie niestandardowych agentów do czyszczenia skrzynki odbiorczej, wysyłania wiadomości, zarządzania kalendarzem, organizowania podróży lub automatyzacji powtarzających się zadań w cyfrowym życiu.

Może być zainstalowany w Windows, macOS i LinuxZostał on również zaprojektowany do lokalnej współpracy z modelami LLM, co zwiększa prywatność i zmniejsza zależność od chmury. Ponadto integruje się z aplikacjami do przesyłania wiadomości, takimi jak WhatsApp, Telegram, Discord, Slack, Signal i Apple Messages, dzięki czemu Twój agent działa „w tle” na czatach, z których już korzystasz.

Za pomocą wtyczek możesz zapewnić mu dostęp do przeglądarki, sieci społecznościowych, klientów poczty e-mail i innych aplikacji, a także zezwolić mu wchodzić w interakcję z systemem plików, wykonywać polecenia i skryptylub automatyzuj typowe zadania biurowe i związane z produktywnością. Wszystko to z wyraźnym naciskiem na umożliwienie użytkownikowi wyboru folderów, aplikacji i usług dostępnych dla agenta.

Janus Pro: model sztucznej inteligencji DeepSeek rewolucjonizuje generowanie obrazów

W bardziej ogólnym ekosystemie platformy takie jak Komputer PerplexityDzięki temu Perplexity przekształca się z prostej wyszukiwarki konwersacyjnej w asystenta zdolnego do realizacji złożonych przepływów pracy. Ten tryb komputerowy pozwala przeglądać sieć, tworzyć i zarządzać dokumentami, pisać kod, przetwarzać dane i koordynować działania z usługami takimi jak Gmail, Slack, GitHub i Notion.

Jego siła tkwi w wykorzystaniu modeli takich jak Claude, GPT, Gemini czy Sonar firmy Perplexity do zarządzania dużymi wolumenami danych i dzielenia złożonych zadań na podzadania, które mogą być wykonywane szeregowo lub równolegle. Choć nie zawsze są one w pełni lokalne, schemat działania agenta i integracja z narzędziami są bardzo podobne do tych, które występują w agentach działających na komputerze.

W czysto otwartym kodzie źródłowym i lokalnym, Styczeń AI Jest to zamiennik ChatGPT, który można zainstalować w systemach Windows, Mac i Linux. Pozwala na korzystanie z modeli lokalnych, takich jak Llama (Meta) lub Gemma (Google), albo na łączenie się z modelami online, takimi jak ChatGPT, Claude, Gemini, Mistral, Qwen lub DeepSeek, jeśli interesuje Cię połączenie obu tych modeli.

Jan AI pracuje zarówno jako klasyczny asystent konwersacyjny (pytaj, twórz szkice, streszczaj, tłumacz, przepisuj, wyjaśniaj) jako agent zdolny do przetwarzania plików i dokumentów, wykonywania poleceń i generowania kodu w różnych językach. Co więcej, jego możliwości personalizacji ułatwiają tworzenie własnego agenta z konkretnymi instrukcjami i przełączanie się między różnymi „profilami” w zależności od wykonywanej czynności.

Agenci na urządzeniu: PocketBot i automatyzacja mobilna

Koncepcja Lokalna sztuczna inteligencja nie pozostaje na komputerzeMa to również duży wpływ na rynek telefonów komórkowych, gdzie coraz więcej projektów opiera się na małych, ale wyspecjalizowanych modelach automatyzujących działanie telefonu bez korzystania z chmury.

Dobrym przykładem jest PocketBot, agent działający bezpośrednio na iPhone używający flame.cpp na MetalJego misją jest konwersja języka naturalnego na automatyzację rozmów telefonicznych: zamiast przechodzić przez tysiące menu i skrótów, opisujesz, czego chcesz, a agent zajmuje się przełożeniem tego na działania.

PocketBot wykorzystuje kwantyzowany model 3.000 miliardów parametrówDziała całkowicie lokalnie i bez wysyłania danych na serwery zewnętrzne. Dostępna pamięć w iPhonie 15 Pro to zazwyczaj 3-4 GB, zanim iOS zacznie zamykać procesy, dlatego rozmiar modelu i kwantyzacja mają kluczowe znaczenie.

Jednym z wyzwań, o których wspominają twórcy, jest znalezienie Niezawodne małe modele do wywoływania narzędzi i ustrukturyzowanych wyników W JSON. Na przykład korzystając z Qwen3, napotykają problemy takie jak wymyślone nazwy parametrów, błędnie sformatowany JSON (brakujące nawiasy) i niespójna zgodność ze schematem, co wymusza implementację warstw autokorekty i ponawiania prób.

Wiele dyskusji toczy się również na temat optymalny punkt kwantyzacji Aby uzyskać najlepszy stosunek jakości do pamięci, rozważ opcje takie jak q4_K_M lub q5_K_S, w zależności od generacji układu scalonego i dostępnej pamięci. Każdy bit mniej w kwantyzacji oznacza bardziej zarządzalne modele, ale może to negatywnie wpłynąć na wnioskowanie i dokładność wywołań narzędzi.

Kolejnym frontem jest dostosowanie parametry próbkowania W zależności od zadania. Typowe konfiguracje obejmują temperaturę 0,7, top_p 0,8, top_k 20 i powtarzanie_penalty 1,1, ale istnieje zainteresowanie oddzieleniem strategii generowania dla swobodnej konwersacji od wywoływania narzędzi, gdzie liczy się więcej determinizmu i mniej kreatywności.

Na koniec, na telefonie komórkowym zarządzanie kontekstem Jest to szczególnie delikatne: monit systemowy jest zwykle buforowany w pamięci podręcznej KV, aby uniknąć ponownego przetwarzania, a okna przesuwne są używane w celu uniknięcia przekroczenia pojemności; dlatego przydatna jest wiedza, jak zapisz i uporządkuj swoje monity.

Poza tym jest jeszcze miejsce na stopniowe podsumowania, selektywną pamięć lub hybrydowe schematy łączące skompresowaną historię i bezpośredni kontekst.

Skonfiguruj własny „lokalny ChatGPT” za pomocą Ollama i Open WebUI

Dla tych, którzy nie potrzebują tak złożonego stosu jak NemoClaw, ale chcą asystent typu ChatGPT działający na Twoim komputerzePopularnością cieszy się bardzo praktyczne podejście bazujące na Ollama i Open WebUI.

Pomysł jest prosty: Ollama Odpowiada za pobieranie i obsługę modeli (Llama, Gemma, Qwen itp.) na Twoim komputerze za pośrednictwem lokalnego interfejsu API, a Open WebUI oferuje interfejs sieciowy bardzo podobny do ChatGPT, ale działający w całości na Twoim komputerze. Cały ruch między interfejsem użytkownika a modelem odbywa się przez localhost.

Bardzo prosty przewodnik krok po kroku szczegółowo opisuje, jak za pomocą kilku 15 poleceń terminalaMożesz uruchomić tę konfigurację w niecałą godzinę. Obejmuje ona instalację Pythona 3.11, podstawową konfigurację systemu, instalację Ollama i wdrożenie Open WebUI, a także zrzuty ekranu i wskazówki dotyczące rozwiązywania problemów.

Rezultatem jest środowisko, w którym możesz się dobrze bawić bezpłatne subskrypcjePełna prywatność (dane nigdy nie opuszczają Twojego komputera), konkurencyjne czasy reakcji (brak kolejek na współdzielonych serwerach) i pełna swoboda w dostosowywaniu specjalistycznych asystentów do Twoich potrzeb.

Ponadto Open WebUI integruje zaawansowane funkcje, takie jak: Przeszukiwanie sieci, interpreter kodu, tworzenie niestandardowych modeli W oparciu o określone konfiguracje, przygotowuje zaawansowane funkcje RAG do budowania osobistych baz wiedzy. Idea polega na tym, że możesz mieć przeszkolonego „drugiego pilota” znającego Twoje dokumenty i przepływy pracy, bez polegania na osobach trzecich.

Bezpieczeństwo SELinux: Kontroluj swój system Linux z dokładnością do milimetra

Po kilku miesiącach użytkowania wielu użytkowników stwierdza, że ta kombinacja całkowicie zastąpiła [poprzedni produkt/usługę]. ich płatne subskrypcje rozwiązań chmurowychJednocześnie usprawniając integrację z własnymi lokalnymi danymi i narzędziami. Kolejnym naturalnym krokiem jest połączenie tego „domowego ChatGPT” z agentami, skryptami i usługami w celu koordynowania bardziej złożonych automatyzacji.

Zautomatyzuj swoje cyfrowe życie: praktyczne przykłady z lokalną sztuczną inteligencją

Wszystko to brzmi świetnie z technicznego punktu widzenia, ale co tak naprawdę można z tego zrobić w życiu codziennym? dobrze wyszkoleni lokalni agenciMożliwości są bardzo szerokie, jeśli połączymy modele multimodalne, dostęp do ekranu, narzędzia i ustrukturyzowane przechowywanie danych.

Istnieją propozycje przeznaczone dla zautomatyzuj korzystanie z własnego komputera Z agentami, którzy odbierają zrzuty ekranu i na nie reagują. Przebieg wyglądałby mniej więcej tak: system wykonuje zrzut ekranu, agent przetwarza go za pomocą modelu obsługującego obrazy, rozpoznaje, która aplikacja jest otwarta, jakie przyciski są obecne, jaki tekst się wyświetla i na podstawie komunikatu podejmuje decyzję, co zrobić dalej.

Dzięki temu pomysłowi możesz na przykład: założyć wyspecjalizowane agencje tłumaczenioweSystem przechwytuje fragment ekranu, który chcesz przetłumaczyć, powiększa go w oknie „tłumacza-lupy” i generuje niemal natychmiastowe tłumaczenie, wykorzystując niewielki model (np. 4B parametrów) precyzyjnie dostrojony do tłumaczenia, niczym precyzyjnie dostrojona wersja PHI.

Innym ciekawym frontem jest Modele wizualne, które przekształcają zrzuty ekranu w pliki PDFWyobraź sobie narzędzie, które na podstawie zrzutów ekranu prezentacji, pulpitów nawigacyjnych lub dokumentów generuje poprawnie sformatowane pliki PDF, które możesz następnie dopracować lub wykorzystać bezpośrednio w swoich prezentacjach. Integrując Pythona z programem Acrobat, możesz zautomatyzować cały proces.

Aby pracować z siecią bez polegania na usługach zewnętrznych, stosuje się technologie weteranów, takie jak BeautifulSoup nadal są bardzo przydatneMożesz skonfigurować lekki skrobak, który przeszukuje kilka stron i zachowuje tylko niezbędny kod HTML (na przykład wyodrębniając tylko , p, h1, h2, h3) i przekazać do modelu tylko przefiltrowany tekst. Dzięki temu redukujesz szumy, masz pełną kontrolę nad tym, co widzi sztuczna inteligencja, i nie musisz już korzystać z zewnętrznych interfejsów API. Jeżeli agent ma również dostęp do kursora i narzędzi do edycji wideo , otwiera to drzwi do automatyzacji zadań w programach takich jak DaVinci Resolve czy Adobe After Effects. Agent porównywał ostatni zrzut ekranu z kolejnym, wnioskował, gdzie należy umieścić mysz i jaką czynność wykonać, aby zbliżyć się do żądanego wyniku. W kontekście audio można zintegrować system głosowy z oceną człowieka : agent generuje frazę (na przykład „Dzień dobry, kochanie”), Ty przyznajesz jej ocenę od 1 do 10 i decydujesz, czy ją zapisać. Za pomocą tej oceny można dostosować parametry takie jak temperatura generowania, można też regulować ją ręcznie z dedykowanego okna. Zapisując narrację w plikach typu {phrase}-{number}.mp3 lub .wav , możesz ponownie wykorzystać i łączyć głosy w przyszłych sesjach. Modele takie jak Bark, licencjonowane przez MIT, doskonale nadają się do niemal nieskończonych personalizacji, a nawet, gdy ma to sens, dodają niuansów emocjonalnych. Aby uporządkować wszystkie te informacje, konieczne jest zapewnienie agentowi uporządkowanego folderu osobistego na Twoim komputerze: user-info/, search-data/, screenshots/, screenshots-for-translate/, voices/, lang/, code-spaces/… Zamiast przesyłać kod do serwisu GitHub, możesz zapisać projekty lokalnie i wybrać, z których repozytoriów lub folderów agent będzie korzystał jako z kontekstu w każdej sesji. Na koniec, jeśli chcesz, aby model dostosowywał się do Ciebie przez pewien czas, możesz wypróbować lekkie techniki dostrajania, takie jak LoRA lub QLoRA . Podejścia te pozwalają dostosować model do własnego stylu lub dziedziny bez konieczności ponownego uczenia wszystkiego od podstaw. Jednak w środowiskach, w których najważniejsza jest czysta produktywność, nie warto pozostawiać tej opcji aktywnej przez cały czas. Najlepiej byłoby, gdybyś miał możliwość aktywowania lub dezaktywowania tego dostosowania. W tym kontekście wybór modelu bazowego staje się również istotny: wielu deweloperów poszukuje modeli Apache-2.0 lub MIT , zarówno o małych rozmiarach (2–4 mld parametrów) w przypadku prototypów i skromnych urządzeń, jak i w modelach 30 mld trenowanych przy użyciu zaawansowanego sprzętu (np. procesorów graficznych A100) w przypadku dostrajania na dużą skalę. Szacuje się, że kilka miesięcy poważnej pracy w tej dziedzinie może przynieść bardzo konkurencyjne rezultaty. Patrząc na cały ekosystem jako całość, automatyzacja sztucznej inteligencji na miejscu przestaje być eksperymentem i staje się solidną infrastrukturą , zarówno dla indywidualnych użytkowników, którzy mają dość miesięcznych opłat, jak i dla firm, które nie mogą sobie pozwolić na przechowywanie poufnych danych poza siedzibą firmy. Desde stacks listos para producción como NemoClaw hasta configuraciones caseras con Ollama y Open WebUI, pasando por agentes de escritorio y móviles como OpenClaw, Jan AI o PocketBot, el denominador común es el mismo: más control, más privacidad y una autonomía de la IA que, por primera vez, puedes gobernar tú.</p> <div class="post-relacionado-wrapper"><a href="https://informatecdigital.com/microsoft-mu-la-nueva-ia-local-que-revoluciona-la-configuracion-en-windows-11/?utm_source=destacado-inside" class="post-relacionado"><picture fetchpriority="high" decoding="async" class="attachment-medium size-medium wp-post-image"> <source type="image/webp" data-lazy-srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg.webp 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg.webp 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg.webp 1200w" sizes="(max-width: 400px) 100vw, 400px"/> <img fetchpriority="high" decoding="async" width="400" height="225" src="data:image/svg+xml,%3Csvg%20xmlns='http://www.w3.org/2000/svg'%20viewBox='0%200%20400%20225'%3E%3C/svg%3E" alt="microsoft mu ia-0" data-lazy-srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg 1200w" data-lazy-sizes="(max-width: 400px) 100vw, 400px" data-lazy-src="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg"/><noscript><img fetchpriority="high" decoding="async" width="400" height="225" src="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg" alt="microsoft mu ia-0" srcset="https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-400x225.jpg 400w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0-768x432.jpg 768w, https://informatecdigital.com/wp-content/uploads/2025/06/microsoft-mu-ia-0.jpg 1200w" sizes="(max-width: 400px) 100vw, 400px"/></noscript> </picture> <div><div>Related article:</div><div class="post-relacionado-title">Microsoft Mu: la nueva IA local que revoluciona la configuración en Windows 11</div></div></a></div> <div id="toc_container" class="no_bullets"><p class="toc_title">Tabla de Contenidos</p><ul class="toc_list"><li><a href="#Que_es_la_automatizacion_con_IA_local_y_por_que_importa">Qué es la automatización con IA local y por qué importa</a></li><li><a href="#Stacks_de_IA_local_para_automatizacion_avanzada_NemoClaw_OpenShell_y_OpenClaw">Stacks de IA local para automatización avanzada: NemoClaw, OpenShell y OpenClaw</a></li><li><a href="#Seguridad_sandboxing_y_despliegue_local_paso_a_paso">Seguridad, sandboxing y despliegue local paso a paso</a></li><li><a href="#Acceso_remoto_interfaz_web_y_hardware_pensado_para_IA_local">Acceso remoto, interfaz web y hardware pensado para IA local</a></li><li><a href="#Agentes_de_IA_locales_populares_ejemplos_y_casos_de_uso">Agentes de IA locales populares: ejemplos y casos de uso</a></li><li><a href="#Agentes_en_el_dispositivo_PocketBot_y_automatizacion_en_el_movil">Agentes en el dispositivo: PocketBot y automatización en el móvil</a></li><li><a href="#Montar_tu_propio_ChatGPT_local_con_Ollama_y_Open_WebUI">Montar tu propio “ChatGPT local” con Ollama y Open WebUI</a></li><li><a href="#Automatizar_tu_vida_digital_ejemplos_practicos_con_IA_local">Automatizar tu vida digital: ejemplos prácticos con IA local</a></li></ul></div> </div> <footer class="entry-meta" aria-label="Meta de entradas"> <span class="cat-links"><span class="gp-icon icon-categories"><svg viewBox="0 0 512 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em"><path d="M0 112c0-26.51 21.49-48 48-48h110.014a48 48 0 0143.592 27.907l12.349 26.791A16 16 0 00228.486 128H464c26.51 0 48 21.49 48 48v224c0 26.51-21.49 48-48 48H48c-26.51 0-48-21.49-48-48V112z" /></svg></span><span class="screen-reader-text">Categorías </span><a href="https://informatecdigital.com/inteligencia-artificial/" rel="category tag">Inteligencia Artificial</a>, <a href="https://informatecdigital.com/seguridad/" rel="category tag">Seguridad</a></span> <nav id="nav-below" class="post-navigation" aria-label="Entradas"> <div class="nav-previous"><span class="gp-icon icon-arrow-left"><svg viewBox="0 0 192 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em" fill-rule="evenodd" clip-rule="evenodd" stroke-linejoin="round" stroke-miterlimit="1.414"><path d="M178.425 138.212c0 2.265-1.133 4.813-2.832 6.512L64.276 256.001l111.317 111.277c1.7 1.7 2.832 4.247 2.832 6.513 0 2.265-1.133 4.813-2.832 6.512L161.43 394.46c-1.7 1.7-4.249 2.832-6.514 2.832-2.266 0-4.816-1.133-6.515-2.832L16.407 262.514c-1.699-1.7-2.832-4.248-2.832-6.513 0-2.265 1.133-4.813 2.832-6.512l131.994-131.947c1.7-1.699 4.249-2.831 6.515-2.831 2.265 0 4.815 1.132 6.514 2.831l14.163 14.157c1.7 1.7 2.832 3.965 2.832 6.513z" fill-rule="nonzero" /></svg></span><span class="prev"><a href="https://informatecdigital.com/personalidad-en-smart-home-del-hogar-conectado-al-hogar-que-te-entiende/" rel="prev">Personalidad en smart home: del hogar conectado al hogar que te entiende</a></span></div> </nav> </footer> </div> </article> </main> </div> <div data-rocket-location-hash="0b9fe17c76c2e58ac880f2c41872dd87" class="widget-area sidebar is-right-sidebar" id="right-sidebar"> <div class="inside-right-sidebar"> </div> </div> </div> </div> <div class="no-wpr-lazyrender site-footer"> <footer class="gb-container gb-container-925a2a1e"> <div class="gb-container gb-container-cbee1dca"> <div class="gb-grid-wrapper gb-grid-wrapper-51f71b20"> <div class="gb-grid-column gb-grid-column-4f4cf5cf"><div class="gb-container gb-container-4f4cf5cf"> <h2 class="gb-headline gb-headline-5c3b3482 gb-headline-text">Informática y Tecnología Digital</h2> <p class="gb-headline gb-headline-e29c0825 gb-headline-text">En <strong>InformaTecDigital</strong> nos dedicamos a proporcionarte las noticias más recientes y sugerencias efectivas, para que estés siempre al día y bien informado. Nuestro objetivo es ser tu socio de confianza en este emocionante recorrido tecnológico, haciendo más fácil tu experiencia con cada nuevo descubrimiento.</p> </div></div> <div class="gb-grid-column gb-grid-column-04e24954"><div class="gb-container gb-container-04e24954"> <h2 class="gb-headline gb-headline-3e937023 gb-headline-text">Categorías</h2> <p class="gb-headline gb-headline-3f1b1c14 gb-headline-text"><a href="https://informatecdigital.com/tecnologia/">Tecnología</a></p> <p class="gb-headline gb-headline-6500416f gb-headline-text"><a href="https://informatecdigital.com/inteligencia-artificial/">Inteligencia Artificial</a></p> <p class="gb-headline gb-headline-86bfcc6a gb-headline-text"><a href="https://informatecdigital.com/programacion/">Programación</a></p> <p class="gb-headline gb-headline-f9d791fe gb-headline-text"><a href="https://informatecdigital.com/algoritmos/">Algoritmos</a></p> <p class="gb-headline gb-headline-1d5a060c gb-headline-text"><a href="https://informatecdigital.com/informatica/">Informática</a></p> <p class="gb-headline gb-headline-ebbabf05 gb-headline-text"><a href="https://informatecdigital.com/internet/">Internet</a></p> </div></div> <div class="gb-grid-column gb-grid-column-1d8f8f12"><div class="gb-container gb-container-1d8f8f12"> <h2 class="gb-headline gb-headline-529b3704 gb-headline-text">síguenos</h2> <div class="gb-container gb-container-8d3b0714"> <a class="gb-button gb-button-8a872c76" href="https://x.com/informatecd" target="_blank" rel="noopener noreferrer" aria-label="Follow Us on Twitter"><span class="gb-icon"><svg aria-hidden="true" role="img" height="1em" width="1em" viewBox="0 0 512 512" xmlns="http://www.w3.org/2000/svg"><path fill="currentColor" d="M389.2 48h70.6L305.6 224.2 487 464H345L233.7 318.6 106.5 464H35.8L200.7 275.5 26.8 48H172.4L272.9 180.9 389.2 48zM364.4 421.8h39.1L151.1 88h-42L364.4 421.8z"></path></svg></span></a> </div> </div></div> </div> <div class="gb-container gb-container-68b619a0"> <p class="gb-headline gb-headline-368a465b gb-headline-text">© 2026 InformaTecDigital</p> <div class="gb-container gb-container-26043e29"> <p class="gb-headline gb-headline-fcb53bf6 gb-headline-text"><a href="https://informatecdigital.com/quienes-somos/">Quienes Somos</a></p> <p class="gb-headline gb-headline-e38f9197 gb-headline-text"><a href="https://informatecdigital.com/aviso-legal/" data-type="page" data-id="24">Aviso Legal</a></p> <p class="gb-headline gb-headline-f9af17bf gb-headline-text"><a href="https://informatecdigital.com/formulario-de-contacto/">Contacto</a></p> </div> </div> </div> </footer> <p></p> </div> <script type="speculationrules"> {"prefetch":[{"source":"document","where":{"and":[{"href_matches":"/*"},{"not":{"href_matches":["/wp-*.php","/wp-admin/*","/wp-content/uploads/*","/wp-content/*","/wp-content/plugins/*","/wp-content/themes/abn-generatepress-adsense/*","/wp-content/themes/generatepress/*","/*\\?(.+)"]}},{"not":{"selector_matches":"a[rel~=\"nofollow\"]"}},{"not":{"selector_matches":".no-prefetch, .no-prefetch a"}}]},"eagerness":"conservative"}]} </script> <script type="text/rocketlazyloadscript" id="generate-a11y"> !function(){"use strict";if("querySelector"in document&&"addEventListener"in window){var e=document.body;e.addEventListener("pointerdown",(function(){e.classList.add("using-mouse")}),{passive:!0}),e.addEventListener("keydown",(function(){e.classList.remove("using-mouse")}),{passive:!0})}}(); </script> <div data-rocket-location-hash="9089b6fff3545f5f3220e195bce56095" class="gp-modal gp-search-modal" id="gp-search" role="dialog" aria-modal="true" aria-label="Buscar"> <div data-rocket-location-hash="e7419566db319650b22985a79bd613d4" class="gp-modal__overlay" tabindex="-1" data-gpmodal-close> <div data-rocket-location-hash="17238aeffc6392939f4952b095835f70" class="gp-modal__container"> <form role="search" method="get" class="search-modal-form" action="https://informatecdigital.com/"> <label for="search-modal-input" class="screen-reader-text">Buscar:</label> <div class="search-modal-fields"> <input id="search-modal-input" type="search" class="search-field" placeholder="Buscar..." value="" name="s" /> <button aria-label="Buscar"><span class="gp-icon icon-search"><svg viewBox="0 0 512 512" aria-hidden="true" xmlns="http://www.w3.org/2000/svg" width="1em" height="1em"><path fill-rule="evenodd" clip-rule="evenodd" d="M208 48c-88.366 0-160 71.634-160 160s71.634 160 160 160 160-71.634 160-160S296.366 48 208 48zM0 208C0 93.125 93.125 0 208 0s208 93.125 208 208c0 48.741-16.765 93.566-44.843 129.024l133.826 134.018c9.366 9.379 9.355 24.575-.025 33.941-9.379 9.366-24.575 9.355-33.941-.025L337.238 370.987C301.747 399.167 256.839 416 208 416 93.125 416 0 322.875 0 208z" /></svg></span></button> </div> </form> </div> </div> </div> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/plugins/gp-premium/menu-plus/functions/js/sticky.min.js?ver=2.5.5" id="generate-sticky-js" data-rocket-defer defer></script> <script id="toc-front-js-extra"> var tocplus = {"visibility_show":"mostrar","visibility_hide":"ocultar","visibility_hide_by_default":"1","width":"100%"}; //# sourceURL=toc-front-js-extra </script> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/plugins/table-of-contents-plus/front.min.js?ver=2411.1" id="toc-front-js" data-rocket-defer defer></script> <script type="text/rocketlazyloadscript" id="generate-menu-js-before"> var generatepressMenu = {"toggleOpenedSubMenus":true,"openSubMenuLabel":"Abrir el submen\u00fa","closeSubMenuLabel":"Cerrar el submen\u00fa"}; //# sourceURL=generate-menu-js-before </script> <script type="text/rocketlazyloadscript" data-rocket-src="https://informatecdigital.com/wp-content/themes/generatepress/assets/js/menu.min.js?ver=3.6.1" id="generate-menu-js" data-rocket-defer defer></script> <script type="text/rocketlazyloadscript" data-minify="1" data-rocket-src="https://informatecdigital.com/wp-content/cache/min/1/wp-content/themes/generatepress/assets/dist/modal.js?ver=1777299219" id="generate-modal-js" data-rocket-defer defer></script> <script>window.lazyLoadOptions=[{elements_selector:"img[data-lazy-src],.rocket-lazyload",data_src:"lazy-src",data_srcset:"lazy-srcset",data_sizes:"lazy-sizes",class_loading:"lazyloading",class_loaded:"lazyloaded",threshold:300,callback_loaded:function(element){if(element.tagName==="IFRAME"&&element.dataset.rocketLazyload=="fitvidscompatible"){if(element.classList.contains("lazyloaded")){if(typeof window.jQuery!="undefined"){if(jQuery.fn.fitVids){jQuery(element).parent().fitVids()}}}}}},{elements_selector:".rocket-lazyload",data_src:"lazy-src",data_srcset:"lazy-srcset",data_sizes:"lazy-sizes",class_loading:"lazyloading",class_loaded:"lazyloaded",threshold:300,}];window.addEventListener('LazyLoad::Initialized',function(e){var lazyLoadInstance=e.detail.instance;if(window.MutationObserver){var observer=new MutationObserver(function(mutations){var image_count=0;var iframe_count=0;var rocketlazy_count=0;mutations.forEach(function(mutation){for(var i=0;i<mutation.addedNodes.length;i++){if(typeof mutation.addedNodes[i].getElementsByTagName!=='function'){continue} if(typeof mutation.addedNodes[i].getElementsByClassName!=='function'){continue} images=mutation.addedNodes[i].getElementsByTagName('img');is_image=mutation.addedNodes[i].tagName=="IMG";iframes=mutation.addedNodes[i].getElementsByTagName('iframe');is_iframe=mutation.addedNodes[i].tagName=="IFRAME";rocket_lazy=mutation.addedNodes[i].getElementsByClassName('rocket-lazyload');image_count+=images.length;iframe_count+=iframes.length;rocketlazy_count+=rocket_lazy.length;if(is_image){image_count+=1} if(is_iframe){iframe_count+=1}}});if(image_count>0||iframe_count>0||rocketlazy_count>0){lazyLoadInstance.update()}});var b=document.getElementsByTagName("body")[0];var config={childList:!0,subtree:!0};observer.observe(b,config)}},!1)</script><script data-no-minify="1" async src="https://informatecdigital.com/wp-content/plugins/wp-rocket/assets/js/lazyload/17.8.3/lazyload.min.js"></script><script type="text/rocketlazyloadscript"> /** * Des-Re-Valorizador * Código para hackear valoraciones * Quita el contenido de la columna Valoración de la tabla generada * por el plugin AAWP y asigna una valoración aleatoria entre 4, 4.5 y 5 estrellas. * */ niech colRatings = document.querySelectorAll( 'td.aawp-table__td-rating' ); colRatings.forEach( col => col.innerHTML = addRating() ); niech colRatings2 = document.querySelectorAll( 'span.aawp-product__no-rating' ); colRatings2.forEach( col => col.innerHTML = addRating() ); funkcja dodajOcenę() { const oceny = [ 80, 90, 100 ]; const losoweOceny = oceny[ Math.floor( Math.random() * oceny.length ) ]; zwróć ' '; } var rocket_beacon_data = {"ajax_url":"https:\/\/informatecdigital.com\/wp-admin\/admin-ajax.php","nonce":"44866e9d8e","url":"https:\/\/informatecdigital.com\/ia-local-y-automatizacion-agentes-seguridad-y-casos-reales","is_mobile":false,"width_threshold":1600,"height_threshold":700,"delay":500,"debug":null,"status":{"atf":true,"lrc":true,"preload_fonts":true,"preconnect_external_domain":true},"elements":"img, video, picture, p, main, div, li, svg, section, header, span","lrc_threshold":1800,"preload_fonts_exclusions":["api.fontshare.com","cdn.fontshare.com"],"processed_extensions":["woff2","woff","ttf"],"external_font_exclusions":[],"preconnect_external_domain_elements":["link","script","iframe"],"preconnect_external_domain_exclusions":["informatecdigital.com","com","hreflang","static.cloudflareinsights.com","rel=\"profile\"","rel=\"preconnect\"","rel=\"dns-prefetch\"","rel=\"icon\""]} Wydajność zoptymalizowana przez WP Rocket. Dowiedz się więcej: https://wp-rocket.me -->