A bizalmas mesterséges intelligencia védi az adatokat és a modelleket a felhőkön keresztül

A bizalmas mesterséges intelligencia védi az adatokat és a modelleket a felhőkön keresztül

Forrás csomópont: 3013578

A mesterséges intelligencia (AI) számos iparágat átalakít, beleértve a pénzügyet, a gyártást, a reklámozást és az egészségügyet. IDC előrejelzése szerint a mesterséges intelligenciára fordított globális kiadások 300-ra meghaladják a 2026 milliárd dollárt. A vállalatok dollármilliókat költenek AI modellek építésére, amelyek felbecsülhetetlen értékű szellemi tulajdonnak számítanak, a paraméterek és a modell súlya pedig szigorúan őrzött titkok. Még a versenytárs modelljének egyes paramétereinek ismerete is értékes intelligenciának számít.

Az e modellek betanításához használt adatkészletek szintén nagyon bizalmasak, és versenyelőnyt teremthetnek. Ennek eredményeként az adat- és modelltulajdonosok igyekeznek megvédeni ezeket az eszközöket a lopástól vagy a megfelelőség megsértésétől. Biztosítaniuk kell a titoktartást és az integritást.

Ezzel elérkeztünk a bizalmas mesterséges intelligencia új területéhez. A bizalmas mesterséges intelligencia célja annak biztosítása, hogy a modell létrehozása, betanítása, előfeldolgozása és a betanítási adatok kezelése – valamint a modell és az adatok életciklusa során történő végrehajtása – nyugalmi állapotban védve legyen a kompromisszumoktól, manipulációtól és expozíciótól. szállítás és használatban van. Kitől védve? Infrastruktúra-szolgáltatóktól, szélhámos rendszergazdáktól, modelltulajdonosoktól, adattulajdonosoktól és más szereplőktől, akik ellophatják vagy megváltoztathatják a modell vagy az adatok kritikus elemeit. A bizalmas mesterséges intelligencia hangsúlyozza az irányelvek szigorú betartatását és zéró bizalom elvei.

Használjon eseteket a bizalmas mesterséges intelligencia számára

A bizalmas mesterséges intelligencia számos technológiát és képességet igényel, néhány újat és a meglévő hardver és szoftver néhány bővítését. Ebbe beletartozik bizalmas számítástechnika technológiák, mint pl megbízható végrehajtási környezetek (TEE) segít megőrizni az adatok biztonságát használat közben – nem csak a CPU-kon, hanem más platformkomponenseken, például GPU-kon –, valamint a CPU és GPU TEE-k hitelesítésére és megbízhatóságának igazolására használt tanúsítási és házirend-szolgáltatásokat. Olyan szolgáltatásokat is tartalmaz, amelyek biztosítják a megfelelő adatkészletek forrását, előfeldolgozását, tisztítását és címkézését. Végül pedig a kulcskezelési, kulcsközvetítési és -terjesztési szolgáltatások biztosítják, hogy a modellek, adatok, promptok és kontextus titkosítva legyenek, mielőtt hozzáférnének a TEE-n belül, vagy végrehajtásra kézbesítenék őket.

Nézzük meg a négy legfontosabb bizalmas AI-forgatókönyvet.

1. Bizalmas következtetés

Ez a legjellemzőbb felhasználási eset a bizalmas mesterséges intelligencia számára. Egy modellt kiképeznek és bevetnek. A fogyasztók vagy ügyfelek interakcióba lépnek a modellel, hogy előre jelezzék az eredményt, generáljanak kimenetet, betekintést nyerjenek és így tovább.

A modelltulajdonosok és -fejlesztők meg akarják védeni modelljük IP-címét attól az infrastruktúrától, ahol a modellt telepítik – a felhőszolgáltatóktól, szolgáltatóktól és még saját rendszergazdáiktól is. Ez megköveteli, hogy a modellt és az adatokat mindig a megfelelő tulajdonosok által ellenőrzött kulcsokkal titkosítsák, és használatkor tanúsítási szolgáltatásnak kell alávetni. A kulcsközvetítő szolgáltatásnak, ahol a tényleges visszafejtési kulcsok vannak elhelyezve, ellenőriznie kell a tanúsítási eredményeket, mielőtt a visszafejtési kulcsokat biztonságos csatornán kiadná a TEE-knek. Ezután a modellek és az adatok visszafejtésre kerülnek a TEE-ben, mielőtt a következtetés megtörténne.

Ennek a használati esetnek többféle változata lehetséges. Például a következtetési adatok titkosíthatók valós idejű adatokkal, amelyeket közvetlenül a TEE-be továbbítanak. Vagy a generatív mesterséges intelligencia esetében a felhasználótól érkező promptok és kontextus csak a TEE-n belül láthatók, amikor a modellek működnek rajtuk. Végül a következtetés kimenete lehet olyan összegzett információ, amely titkosítást igényel, de nem is. A kimenet egy vizualizációs vagy megfigyelési környezetbe is betáplálható.

2. Bizalmas képzés

Mielőtt bármilyen modell elérhető lenne a következtetések levonására, létre kell hozni őket, majd betanítani kell őket jelentős mennyiségű adatra. A legtöbb forgatókönyv esetében a modellképzés hatalmas számítási teljesítményt, memóriát és tárhelyet igényel. A felhő infrastruktúra kiválóan alkalmas erre, de erős biztonsági garanciákat igényel a nyugalmi, átviteli és használat közbeni adatokra vonatkozóan. A bizalmas következtetésre vonatkozó követelmények a bizalmas képzésre is vonatkoznak, hogy bizonyítsák a modell készítőjének és az adattulajdonosnak, hogy a modell (beleértve a paramétereket, súlyokat, ellenőrzőpontok adatait stb.) és a betanítási adatok nem láthatók a TEE-n kívül. .

A bizalmas mesterséges intelligencia kapcsán gyakran megfogalmazott követelmény a következő: „Szeretném betanítani a modellt a felhőben, de szeretném a legszélső szintre telepíteni, ugyanolyan szintű biztonság mellett. A modell tulajdonosán kívül senki más nem láthatja a modellt.” A bizalmas képzéshez bemutatott megközelítés és a bizalmas következtetések párhuzamosan működnek ennek elérése érdekében. A betanítás végeztével a frissített modell a TEE-n belül ugyanazzal a kulccsal titkosításra kerül, amelyet a betanítási folyamat előtt a visszafejtéshez használtak, és amely a modell tulajdonosé volt.

Ezt a titkosított modellt ezután az AI-következtető alkalmazással együtt telepítik a TEE pereminfrastruktúrájára. Valójában a felhőből töltik le a modelltulajdonoshoz, majd az AI-következtető alkalmazással a szélekig telepítik. Ugyanazt a munkafolyamatot követi, mint a bizalmas következtetés, és a visszafejtési kulcsot a modelltulajdonos kulcsközvetítő szolgáltatása juttatja el a TEE-ekhez, miután ellenőrizte a szélső TEE-k tanúsítási jelentését.

3. A tanulás egyesítése

Ez a technika alternatívát kínál a központosított képzési architektúra helyett, ahol az adatok nem kerülnek áthelyezésre és összesítésre a forrásokból a biztonsági és adatvédelmi aggályok, az adatok tartózkodási helyére vonatkozó követelmények, a méret- és mennyiségi kihívások stb. miatt. Ehelyett a modell az adatokhoz költözik, ahol egy előre minősített és elfogadott folyamatot követ az elosztott képzéshez. Az adatok az ügyfél infrastruktúrájában vannak elhelyezve, és a modell az összes klienshez eljut képzés céljából; egy központi irányító/aggregátor (amelynek a modell tulajdonosa ad otthont) összegyűjti a modellváltozásokat az egyes ügyfelektől, összesíti azokat, és új frissített modellverziót generál.

A modell tulajdonosának nagy gondja itt a modell IP-jének lehetséges kompromisszuma az ügyfél infrastruktúrájában, ahol a modellt képezik. Hasonlóképpen, az adattulajdonos gyakran aggódik a modell gradiens frissítéseinek láthatósága miatt a modell készítője/tulajdonosa számára. Az összevont tanulás és a bizalmas számítástechnika kombinálása erősebb biztonsági és adatvédelmi garanciákat biztosít, és lehetővé teszi a zéró bizalmi architektúrát.

Ehhez az szükséges, hogy a gépi tanulási modelleket a központi kormányzótól biztonságosan telepítse a különböző ügyfelek számára. Ez azt jelenti, hogy a modell közelebb áll a betanításhoz szükséges adatkészletekhez, az infrastruktúra nem megbízható, és a modelleket a TEE-ben képezték ki, hogy segítsenek biztosítani az adatok védelmét és az IP védelmét. Ezt követően egy tanúsítási szolgáltatást rétegeznek, amely ellenőrzi az egyes ügyfelek infrastruktúrájának TEE megbízhatóságát, és megerősíti, hogy a TEE-környezetek megbízhatóak, ahol a modellt betanítják. Végül a betanított modelleket a különböző ügyfelek visszaküldik az aggregátornak vagy kormányzónak. A modell aggregálása a TEE-ken belül történik, a modell frissítésre kerül, és ismételten feldolgozásra kerül, amíg stabil lesz, majd a végső modellből következtet.

4. Bizalmas hangolás

A mesterséges intelligencia egyik feltörekvő forgatókönyve az, hogy a vállalatok általános mesterségesintelligencia-modelleket szeretnének alkalmazni, és üzleti tartomány-specifikus adatok felhasználásával hangolják azokat, amelyek jellemzően a szervezet sajátjai. Az elsődleges indoklás a modell finomhangolása és pontosítása a tartományspecifikus feladatokhoz. Előfordulhat például, hogy egy IT-támogatást és szolgáltatást menedzselő cég felvesz egy meglévő LLM-et, és kiképzi az IT-támogatással és a help desk-specifikus adatokkal, vagy egy pénzügyi cég finomhangolhat egy alapítványi LLM-t védett pénzügyi adatok felhasználásával.

Ez a finomhangolás nagy valószínűséggel külső felhő-infrastruktúrát igényel, tekintettel a számítási, memória- és tárolási igényekre. A bizalmas képzési architektúra segíthet megvédeni a szervezet bizalmas és védett adatait, valamint a védett adatokkal hangolt modellt.

Időbélyeg:

Még több Sötét olvasmány