DevOps s umjetnom inteligencijom i LLMOps: praktični vodič za timove

Informatec Digital » Sredstva » DevOps s umjetnom inteligencijom i LLMOps: od cjevovoda do modela koji govori

LLMOps proširuje DevOps i MLOps kako bi upravljao ponašanjem LLM-baziranih aplikacija u produkciji.
GenAIOps s promptnim tokom u Azureu integrira repozitorije, cjevovode i kontinuiranu evaluaciju za promptne tokove.
Konvergencija ChatOpsa, LLMOpsa i DevOpsa omogućuje konverzacijske, automatizirane i uočljive operacije.
Postupno i dobro upravljano usvajanje smanjuje sigurnosne rizike, troškove i organizacijsku složenost.

DevOps s umjetnom inteligencijom i LLMOps-ima

Pojava generativne umjetne inteligencije i velikih jezičnih modela potpuno je promijenila način na koji se softver gradi, implementira i koristi. Imati dobre stvari više nije dovoljno. DevOps cjevovodi niti primjenom klasičnih MLO-ovaKada u jednadžbu uvedete LLM, ulazite u područje u kojem model govori, obrazlaže, improvizira i ponekad se ponaša na nepredvidljive načine.

U ovom novom scenariju, Timovi trebaju kombinirati DevOps, AI i LLMOps kako bi upravljali cijelim životnim ciklusom aplikacija temeljenih na LLM-u.Od eksperimentiranja i brzog inženjeringa do implementacije, praćenja, sigurnosti i optimizacije troškova, ovaj članak svodi svu tu buku na zemlju i vodi vas korak po korak kroz to kako uklopiti ChatOps, DevOps, MLOps, GenAIOps i LLMOps u moderno poslovanje.

Od DevOps-a i MLOps-a do LLMOps-a: zašto model više nije statičan

Godinama je prioritet inženjerskih timova bio automatizirati isporuku softvera i smanjiti trenje između razvoja i infrastruktureTako je rođen DevOps: kontinuirana integracija, kontinuirano raspoređivanje, infrastruktura kao kod, vidljivost i kultura suradnje koja je eliminirala beskrajne primopredaje između odjela.

Kada su podaci postali dio proizvoda, pojavilo se MLOps kao odgovor na potrebu za reproducibilnošću i sljedivošću modela strojnog učenjaStandardizirane su prakse poput verzioniranja skupova podataka, orkestracije cjevovoda za učenje, otkrivanja pomaka i kontinuirane evaluacije prediktivnih modela.

Problem je u tome LLM-ovi krše mnoge pretpostavke implicitne u DevOps-u i MLO-u.Oni nisu statički API-ji ili jednostavne funkcije koje vraćaju deterministički broj: oni odgovaraju prirodnim jezikom, miješaju kontekst, upute, alate i podatke u stvarnom vremenu te mogu proizvesti dva različita izlaza za isti ulaz.

To podrazumijeva da Nije dovoljno samo promijeniti model i njegove težineTakođer je potrebno kontrolirati upute, predloške, semantičke sigurnosne politike, ograničenja, povezane alate, ubrizgani kontekst, pa čak i poslovna pravila koja uvjetuju ponašanje sustava.

Što je LLMOps i što on zapravo rješava?

LLMOps možemo vidjeti kao operativni okvir koji omogućuje sigurno, kontrolirano i održivo postavljanje, održavanje i skaliranje aplikacija temeljenih na LLM-uTo je krovni okvir pod kojim koegzistiraju DevOps prakse, MLOp-ovi i nove mogućnosti specifične za generativne modele.

U suštini, LLMOps se manje fokusira na "obuku savršenog modela", a više na upravljanje njegovim ponašanjem u produkciji.Uključuje kako su tokovi promptova dizajnirani i verzionirani, kako su LLM-ovi povezani s internim izvorima podataka, kako se prate troškovi tokena i latencija te kako se upravlja semantičkim rizikom (halucinacije, curenje informacija, pristranosti, toksični odgovori itd.).

Potrebe koje LLMOps zadovoljava, a koje DevOps/MLOps sami po sebi ne pokrivaju, uključuju aspekti raznoliki poput sljedivosti razgovora, automatske procjene kvalitete odgovora ili A/B usporedbe varijanti ponašanjaNe govorimo samo o klasičnoj točnosti, već i o dosljednosti, usklađenosti s poslovanjem i sigurnosti.

Osim toga, Troškovi više nisu ograničeni na obuku i hosting modelaSvaki upit, svaki prošireni kontekst i svaki istodobni poziv pokreće potrošnju GPU-a ili tokena u komercijalnim API-jima. Bez LLMOps sloja koji bi ovu potrošnju učinio vidljivom i povezao je s opremom, uslugama i slučajevima upotrebe, račun raste nepredvidivo.

ChatOps + LLMOps + DevOps: operacije postaju konverzacijske

Jedan od najmoćnijih trendova je integracija ChatOpsa i LLMOpsa unutar DevOps kultureUmjesto da budu ograničeni na nadzorne ploče, skripte i cjevovode, timovi počinju upravljati velikim dijelom sustava putem chat kanala poput Slacka, Microsoft Teamsa ili Discorda.

ChatOps predlaže da dnevne operacije (implementacije, upiti u zapisnike, ponovna pokretanja, promjene konfiguracije) izvršavaju ih botovi unutar samog komunikacijskog kanala, transparentno cijelom timu. Svaka naredba, radnja i rezultat bilježe se u razgovoru.

Kada se tom pristupu doda LLM, pojavljuje se novi sloj inteligencije: Chatbotovi koji razumiju prirodni jezik, interpretiraju namjere i mogu izvršavati složene naredbe ili analizirati situacije bez potrebe da operater pamti svaki točan skript ili zastavicu.

Tipični primjeri ove konvergencije uključuju to što Bot, pokretan LLM-om, čita Prometheusove metrike i Lokijeve zapise Kada netko napiše "usluga grupe X je spora" i predloži radnje poput eskalacije replika, vraćanja na prethodno stanje ili pokretanja određenih testova, sve objašnjeno prirodnim jezikom.

DreamStudio: Što je to i kako stvarati slike pomoću umjetne inteligencije

Na kulturnoj i operativnoj razini, to se prevodi u Brže odluke, manje ručnih intervencija u repetitivnim zadacima i glatkije iskustvo za DevOps timove, koji od stalnog gašenja požara prelaze na rad na strateškim poboljšanjima.

Ključni principi životnog ciklusa LLM-a u produkciji

Vođenje ozbiljnog LLM studija nije jednokratni projekt, već ciklus koji se ponavlja i u kojem svaka promjena može promijeniti ponašanje sustavaIako svaka organizacija prilagođava to svojoj stvarnosti, obično postoji šest glavnih faza koje se međusobno nadopunjuju.

Prvo je faza obuke ili prilagodbe modelaTo može varirati od korištenja temeljnog modela kakav jest do primjene finog podešavanja, LoRa ili drugih tehnika podešavanja s vlastitim podacima. Ovdje nije važna samo izvedba, već i cjelovit zapis: skupovi podataka, primijenjeni filteri, hiperparametri, verzije tokenizatora, testirane arhitekture itd.

Ako je ova faza improvizirana i nije dokumentirana, model se rađa bez upravljanjaNakon toga će biti gotovo nemoguće objasniti zašto reagira onako kako reagira ili ponoviti određeni rezultat kada je to potrebno u reviziji.

Druga faza je implementacija, gdje model napušta laboratorij i ulazi u produkciju. U LLMOpsu se ne radi samo o "stavljanju u kontejner": Moramo odlučiti koji hardver koristitiKako upravljati memorijom za dugotrajne kontekste, koju topologiju klastera primijeniti i kako skalirati na temelju prometa bez naglog porasta latencije ili nepodnosljivih troškova.

Tu stvari dolaze do izražaja kontinuirano praćenje usmjereno na ponašanjeNije dovoljno gledati CPU i RAM; potrebno je pratiti semantičku kvalitetu odgovora, stabilnost stila, stopu pogrešaka, evoluciju cijene po tokenu, pojavu opasnih ili nekoherentnih odgovora i promjene u vremenu odgovora pod različitim obrascima korištenja.

U kasnijim fazama provode se zadaci optimizacije i finog podešavanja: dodirne upute, prilagodi RAG, testiraj varijante modela, kvantiziraj, provedi A/B testiranje, promijeni pravila semantičke sigurnosti ili poboljšaj poslovna pravilaTo je gotovo zanatski proces u kojem podaci, inženjerstvo i poslovanje zajedno odlučuju čemu dati prioritet.

Konačno, sve to spada u slojevi sigurnosti i upravljanja (kontrola pristupa, revizija, sprječavanje curenja, ograničenja korištenja, usklađenost s propisima) i u logici kontinuiranog ažuriranja, gdje se model i njegov ekosustav prilagođavaju promjenama podataka, propisima i internim potrebama.

GenAIOps i pristup toku obavijesti u Azureu

Unutar LLMOps svemira postoje vrlo specifični prijedlozi za strukturiranje ovog životnog ciklusa. Jedan od najnaprednijih u korporativnom okruženju je GenAIOps s brzim tokom rada na Azure strojnom učenju integriranom s Azure DevOpsom, koji predlaže vrlo sustavan pristup izgradnji aplikacija temeljenih na LLM-u.

Tijek prompta nije samo uređivač prompta; on je cjelovita platforma za dizajniranje, testiranje, verzioniranje i implementaciju LLM interakcijskih tokova, od jednostavnih slučajeva (jedan upit) do složenih orkestracija s više čvorova, vanjskih alata, kontrola i automatskih evaluacija.

Kritična značajka je centralizirano spremište tokovakoja djeluje kao korporativna knjižnica. Umjesto da svaki tim ima svoje upute u zasebnim dokumentima ili vlastitim repozitorijima, one su konsolidirane u jedan upravljani repozitorij s jasnim granama, revizijama i poviješću.

Osim toga, platforma dodaje mogućnosti eksperimentiranja s varijantama i hiperparametrima: Moguće je testirati različite kombinacije upita, modela, postavki temperature ili sigurnosnih politika u više čvorova toka i usporediti rezultate s jasnim metrikama.

Što se tiče implementacije, GenAIOps s tokom obavijesti Generira Docker slike koje obuhvaćaju i tijek rada i sesiju procesa.Spremni su za pokretanje u okruženjima kao što su Azure App Services, Kubernetes ili upravljani procesi. Na temelju toga, A/B implementacije omogućuju usporedbu verzija toka u stvarnim okruženjima.

Još jedna snaga je upravljanje odnosima između skupova podataka i tokova. Svaki tijek evaluacije može raditi s više standardnih i testnih skupova podatakaTo omogućuje validaciju ponašanja u različitim scenarijima prije nego što se nešto stavi u ruke krajnjih korisnika.

Platforma također automatski registrira nove verzije skupova podataka i tokova samo kada postoje stvarne promjene, i Generira sveobuhvatna izvješća u formatima kao što su CSV i HTML. podržati odluke temeljene na podacima, a ne na intuiciji.

Četiri faze GenAIOps-a s tokom obavijesti

GenAIOps pristup rastavlja životni ciklus u četiri jasno diferencirane faze, što pomaže u izbjegavanju tipičnog kaosa "isprobamo stvari s umjetnom inteligencijom i vidimo što će se dogoditi".

Kako prilagoditi ChatGPT i precizno podesiti svoje odgovore poput profesionalca

Prva faza, inicijalizacija, fokusira se na Precizno definirajte poslovni cilj i prikupite reprezentativne primjere podatakaOvdje je navedena osnovna struktura tijeka prompta i dizajnirana je arhitektura, koja će se zatim usavršavati.

U fazi eksperimentiranja, tok se primjenjuje na te uzorke podataka i Procjenjuju se različite varijante promptova, modela i konfiguracija.Proces se neumoljivo ponavlja sve dok se ne pronađe prihvatljiva kombinacija koja zadovoljava minimalne standarde kvalitete i konzistentnosti.

Sljedeća faza je evaluacija i usavršavanje, gdje Veći i raznolikiji skupovi podataka koriste se za provođenje strogih usporednih testovaTek kada tok pokaže dosljedne performanse usklađene s definiranim standardima, smatra se spremnim za sljedeći korak.

Konačno, u fazi implementacije, tijek se optimizira kako bi bio učinkovit i implementiran u produkciji. uključujući opcije A/B implementacije, praćenje, prikupljanje povratnih informacija korisnika i cikluse kontinuiranog poboljšanjaNišta nije uklesano u kamenu: protok se i dalje prilagođava na temelju onoga što se opaža u stvarnoj upotrebi.

Ova metodologija je zapakirana u predložak repozitorija GenAIOps, s unaprijed izgrađenim cjevovodima koji prvo definiraju kod i Lokalni i cloud-bazirani alati za izvršavanje za razvoj, evaluaciju i implementaciju LLM-baziranih aplikacija bez ponovnog izmišljanja kotača u svakom projektu.

Integracija s Azure DevOpsom: repozitoriji, cjevovodi i autentifikacija

Da bi se GenAIOps prenio iz teorije u stvarnu organizaciju, ključna je integracija s Azure DevOpsom. Tipični predložak počinje s repozitorij u Azure Reposu s dvije glavne grane, glavnom i razvojnom, koji odražavaju različita okruženja i strategije promocije koda.

Primjer repozitorija je kloniran s GitHuba, povezan s Azure Reposom i Obično radimo tako da stvaramo grane značajki iz razvoja.Promjene se šalju putem zahtjeva za povlačenjem (pull requests), koji automatski pokreću procese validacije i eksperimentiranja.

Da bi Azure DevOps mogao komunicirati s Azure Machine Learningom i drugim uslugama, konfiguriran je entitet usluge u Azureu kao tehnički identitetOvaj identitet se koristi u vezi usluge Azure DevOps, tako da se cjevovodi autentificiraju bez izlaganja ključeva u običnom tekstu.

Obično ovaj entitet ima vlasničke dozvole za ML pretplatu ili radni resurs, tako da Cjevovodi mogu osigurati krajnje točke, registrirati modele i ažurirati pravila u ključnim spremištimaAko želite pojačati sigurnost, možete prilagoditi ulogu Suradnika prilagođavanjem YAML koraka koji obrađuju dopuštenja.

Osim toga, u Azure DevOpsu se stvara grupa varijabli koje Pohranjuje osjetljive podatke kao što su naziv veze usluge ili identifikatori resursa.Ove varijable su izložene kao okruženje za cjevovode, izbjegavajući tvrdo kodiranje kritičnih informacija u kodu.

Konfiguriranje lokalnih i udaljenih repozitorija omogućuje vam Razvojna grana je zaštićena pravilima grana koji zahtijevaju izvršavanje cjevovoda zahtjeva za povlačenjem prije dopuštanja spajanja. Ovaj cjevovod obrađuje validacije izgradnje i tijekove eksperimentiranja, sprječavajući uvođenje neispravnih promjena.

Nakon što kod uđe u razvoj, pokreće se razvojni proces koji Uključuje kompletne faze CI i CDprovođenje eksperimenata i evaluacija, snimanje tokova u registru modela Azure ML, implementacija krajnjih točaka i testova dima te integracija na novokreiranim krajnjim točkama.

Isti obrazac se replicira na granu verzije ili izdanja, povezanu s produkcijskim okruženjima. Tamo, CI/CD cjevovodi za produkciju ponavljaju ciklus eksperimentiranja, evaluacije i implementacije.ali na podacima na razini infrastrukture i proizvodnje, s većom kontrolom i dodatnim ručnim pregledima ako je potrebno.

Ključni detalj je "pregled ljudske petlje" uključen u ove cjevovode: Nakon CI faze, CD ostaje zaključan dok ga osoba ručno ne odobri. Nastavak je iz sučelja Azure Pipelines. Ako se ne odobri unutar određenog vremena (na primjer, 60 minuta), izvršenje se odbija.

Lokalna implementacija i povezivanje s LLM pružateljima usluga

Ne vrti se sve oko cjevovoda: GenAIOps također podržava lokalno izvršavanje za brzo eksperimentiranjeMožete klonirati repozitorij predložaka, stvoriti .env datoteku u korijenskom direktoriju i definirati veze s Azure OpenAI-jem ili drugim kompatibilnim krajnjim točkama unutar njega.

Ove veze uključuju parametre kao što su api_key, api_base, api_type i api_version, te Na njih se referira po imenu unutar tokova (na primjer, veza pod nazivom "aoai" s određenom verzijom API-ja). Na taj se način isti tok može izvršiti lokalno i u oblaku bez promjena koda.

Što radi voditelj razvoja softvera?

Za korištenje ovog načina rada, jednostavno stvoriti virtualno okruženje ili conda i instalirati potrebne ovisnosti (promptflow, promptflow-tools, promptflow-sdk, openai, jinja2, python-dotenv, itd.). Od tamo možete pisati testne skripte u lokalnoj mapi za izvršavanje i pokretati eksperimente na definiranim tokovima.

Ova dualnost oblaka/lokalnog okruženja vrlo se dobro uklapa sa zrelim DevOps načinom razmišljanja: Testira se lokalno u malom opsegu, formalno validira u cjevovodima, a zatim se promovira u okruženja više razine s kontrolama i revizijom.Sve je verzionirano u Gitu i povezano s Azure DevOps-om.

Tipični alati u DevOps ekosustavu s umjetnom inteligencijom i LLMOps-om

Osim specifične Azureove ponude, moderni DevOps ekosustav s umjetnom inteligencijom i LLMOps-om obično se oslanja na skup alata koji pokrivaju ChatOps, orkestraciju modela, praćenje i observabilnost.

U ChatOps sloju uobičajeno je kombinirati Slack s botovima poput HubotaMicrosoft Teams surađuje s agentima temeljenima na Power Virtual Agentsima ili Discordu, zajedno s okvirima poput Botpressa ili Rase, za izradu prilagođenih asistenata koji se povezuju s cjevovodima, sustavima za nadzor i internim uslugama.

U ravnini LLMOps/MLOps, oni su česti platforme poput Kubeflow i MLflow za upravljanje cjevovodima, zapisima modela i eksperimentima, kao i specifične alate poput težina i pristranosti (W&B) za napredno praćenje metrika, usporedbe izvođenja ili detaljne vizualizacije.

Za izgradnju aplikacija na LLM-u uobičajeno je koristiti okviri poput biblioteka tipa LangChain ili OpenLLMOva rješenja olakšavaju sastavljanje lanaca promptova, konektora s vanjskim podacima, alata i višekoračnih agenata. Istovremeno se pojavljuju rješenja za LLM-specifičnu promjenjivost, koja omogućuju praćenje promptova, odgovora, troškova i kvalitete.

U integraciji s klasičnim DevOpsom, alati poput Jenkinsa ili GitLaba CI ostaju relevantni za CI/CD dio, Kubernetes i ArgoCD za kontinuirano implementaciju u oblakui stogove za promatranje poput Prometheusa, Grafane i Lokija za metrike, nadzorne ploče i zapisnike.

Izazovi, ograničenja i postupno usvajanje

Sva ova primjena praksi i alata ne dolazi besplatno. Složenost upravljanja upitima, verzijama modela i varijantama toka je znatno, posebno kada više timova radi istovremeno —scenarij u kojem je preporučljivo primijeniti strategije poput GitOpsa koordinirati promjene i implementacije.

Osim toga, ChatOps botovi i sami LLM-ovi s mogućnošću djelovanja Oni predstavljaju značajne sigurnosne rizike ako imaju prekomjerna dopuštenja u produkcijskim okruženjima ili ako površine izloženosti podataka nisu pravilno kontrolirane.

Ovome se dodaje i ovisnost o modelima otvorenog koda s osjetljivim licencama ili komercijalnim API-jima što može promijeniti uvjete, cijene ili ograničenja. I, što je još gore, robusna evaluacija LLM-ova u proizvodnji ostaje otvoreno područje, s mnogim pitanjima koja još uvijek nisu odgovorena.

Stoga ima smisla pozabaviti se usvajanjem LLMOps-ova i ChatOps-ova unutar DevOps-a. na progresivan i kontroliran način, počevši od automatizacije repetitivnih zadataka s jednostavnim botovima (ponovna pokretanja, upiti u zapisnike, označavanje izrade itd.).

Kasnije se mogu uvesti LLM za zadatke podrške, klasifikaciju incidenata ili pomoć pri otklanjanju pogrešakaNa primjer, objašnjavanjem pogrešaka na temelju zapisnika ili predlaganjem ublažavanja na temelju interne dokumentacije.

Nakon što se klasično ML poslovanje stabilizira, vrijeme je za adresirati LLMOps specijaliziranim jezičnim modelima za domene kao što su korisnička služba, DevSecOps ili QA, iskorištavajući sve naučeno u prethodnim fazama.

Horizont prema kojem sve ove prakse upućuju je konverzacijsko, prediktivno i sve autonomnije inženjersko okruženjegdje se velik dio razvoja i rada izražava prirodnim jezikom, a umjetna inteligencija pomaže u donošenju proaktivnih odluka o implementaciji, skaliranju ili vraćanju prethodnih verzija.

S ovom slagalicom na mjestu – DevOps, ChatOps, MLOps, GenAIOps i LLMOps – organizacije imaju čvrst okvir za izgradnju i održavanje sustava temeljenih na LLM-u koji istinski pružaju vrijednostOdržavanje kontrole nad kvalitetom, troškovima, sigurnošću i usklađenošću s poslovanjem, umjesto da se ostane s jednostavnim prototipovima ili izoliranim testovima koji se raspadaju čim dođu u proizvodnju.

Povezani članak:

Što je Devops? Primjeri i karakteristike

Sadržaj

Od DevOps-a i MLOps-a do LLMOps-a: zašto model više nije statičan
Što je LLMOps i što on zapravo rješava?
ChatOps + LLMOps + DevOps: operacije postaju konverzacijske
Ključni principi životnog ciklusa LLM-a u produkciji
GenAIOps i pristup toku obavijesti u Azureu
Četiri faze GenAIOps-a s tokom obavijesti
Integracija s Azure DevOpsom: repozitoriji, cjevovodi i autentifikacija
Lokalna implementacija i povezivanje s LLM pružateljima usluga
Tipični alati u DevOps ekosustavu s umjetnom inteligencijom i LLMOps-om
Izazovi, ograničenja i postupno usvajanje