Protokół Modelu Kontekstu (MCP): niezbędna wiedza dla integracji AI

Model Context Protocol (MCP) to otwarty standard umożliwiający programistom tworzenie bezpiecznej, dwukierunkowej komunikacji między źródłami danych a narzędziami sztucznej inteligencji (AI). Struktura jest przejrzysta i prosta.Programiści mogą prezentować swoje możliwości za pośrednictwem serwerów MCP lub tworzyć aplikacje AI (agentów MCP), które łączą się z tymi serwerami. Protokół Model Context Protocol (MCP) przyspieszy rozwój inteligentnego handlu (a-commerce). *Uwaga: Inteligentny handel to forma handlu elektronicznego, w której oprogramowanie działa jako agent dla użytkowników, podejmując decyzje zakupowe w ich imieniu.*

Czym jest MCP?

MCP został pierwotnie opracowany przez firmę Anthropic, ale obecnie Również zasilane przez OpenAIW marcu, prezes OpenAI, Sam Altman, ogłosił, że OpenAI doda obsługę protokołu MCP do swoich produktów, w tym aplikacji desktopowej ChatGPT. Inne firmy, w tym Block i Apollo, dodały obsługę protokołu MCP do swoich platform. Sam protokół pozwala modelom AI pobierać dane z różnych źródeł, umożliwiając programistom budowanie dwukierunkowych połączeń między źródłami danych a aplikacjami opartymi na sztucznej inteligencji, takimi jak chatboty.

(Dla zainteresowanych aspektami technicznymiProgramiści udostępniają funkcje za pośrednictwem serwerów MCP, a agenci mogą następnie korzystać z klientów MCP, aby łączyć się z tymi serwerami na żądanie. Agenci wysyłają zapytania do serwerów, aby dowiedzieć się o dostępnych narzędziach. Serwer dostarcza metadane, dzięki którym agent wie, jak korzystać z narzędzi. Gdy agent zdecyduje się użyć narzędzia, wysyła żądanie wywołania narzędzia w standardowym formacie JSON.

Dlaczego to takie ważne? Zapewnia ujednolicony sposób komunikacji i wymiany kontekstu między narzędziami i agentami na temat użytkowników, zadań, danych i celów, a także oferuje następujące funkcje:

InteroperacyjnośćPlatforma MCP umożliwia różnym modelom sztucznej inteligencji, asystentom i aplikacjom zewnętrznym współdzielenie kontekstu, ułatwiając integrację wielu narzędzi i usług opartych na sztucznej inteligencji;

KoordynacjaPlatforma MCP pomaga koordynować zadania między różnymi agentami AI i aplikacjami zewnętrznymi, zapewniając ich bezproblemową współpracę bez powielania pracy lub konieczności częstego wprowadzania danych przez użytkownika;

Zintegrowany ekosystemStandard taki jak MCP umożliwia niezależnym programistom tworzenie wtyczek lub narzędzi, które z łatwością „mówią tym samym językiem” co asystenci wspierani przez sztuczną inteligencję, przyspieszając rozwój ekosystemu. Ta integracja jest niezbędna do szerszego wykorzystania sztucznej inteligencji w różnych aplikacjach.

Przyjrzyjmy się na przykład serwerowi Google Maps MCP. Serwer ten oferuje obecnie siedem funkcji: konwersję adresu na współrzędne (i odwrotnie), wyszukiwanie lokalizacji, uzyskiwanie szczegółowych informacji o lokalizacji, obliczanie odległości między lokalizacjami (wraz z czasem podróży), uzyskiwanie danych o wysokości oraz, oczywiście, wyznaczanie trasy. Funkcje te są niezbędne w aplikacjach mapowych i logistycznych.

Kogo obchodzi MCP? Cóż, wiele organizacji (w tym detaliści, banki i inne) chce rozwijać własne możliwości sztucznej inteligencji, aby ich agenci mogli komunikować się z agentami swoich klientów. Weźmy na przykład handel detaliczny. Hari Vasudev, dyrektor techniczny Walmartu w USA, Mówią Będą tworzyć własnych agentów, którzy będą komunikować się z agentami konsumenckimi, udzielając rekomendacji lub dodatkowych informacji o produktach, podczas gdy agenci konsumencki będą mogli przekazywać agentom detalicznym informacje o preferencjach i inne informacje. Taka interakcja między agentami wzbogaca spersonalizowane doświadczenia zakupowe.

Banki, detaliści i inne podmioty chcą, aby agenci obsługi klienta wchodzili w interakcje z agentami detalicznymi, a nie korzystali ze stron internetowych lub interfejsów API w celu uzyskania dostępu do potrzebnych im usług. Frank Young trafnie podsumowuje tę dynamikę, zauważając, że instytucje udostępniają interfejsy API do obsługi prostych przepływów (takich jak subskrypcje) z wykorzystaniem istniejącej infrastruktury, ale w przypadku front-endu handlu opartego na agentach (negocjacje, reagowanie na oszustwa i optymalizacja) wdrażają serwery MCP, aby rejestrować te złożone, wartościowe scenariusze. Takie podejście umożliwia automatyzację złożonych procesów biznesowych i poprawia wydajność.

Problemy związane z bezpieczeństwem MCP nie zostały jeszcze rozwiązane.

Uważam wizję handlu agentowego za bardzo ekscytującą, ale aby osiągnąć pożądane korzyści, konieczne jest zapewnienie niezbędnej infrastruktury, która zapewni bezpieczeństwo, ochronę i opłacalność. Protokół MCP nie definiuje standardowego mechanizmu wzajemnego uwierzytelniania między serwerami a klientami (Czy to agent Walmart? Czy to agent Dave Birch?), ani sposobu delegowania uwierzytelniania za pomocą interfejsów API (aby mój agent mógł korzystać z otwartej bankowości). Jednym ze sposobów rozwiązania tego problemu jest… Weryfikacja danych uwierzytelniających agenta W zamian za formularz rejestracyjny wprowadzono podstawowy proces KYC (Know Your Customer, czyli Poznaj Swojego Klienta) dla sztucznej inteligencji, do którego dostęp będą mieli tylko zaufani agenci. Może to być zapowiedź bardziej zaawansowanej infrastruktury KYA (Know Your Agent, czyli Poznaj Swojego Agenta).

Ponieważ serwerami MCP zarządzają niezależni programiści i współautorzy, nie istnieje centralna platforma do audytu, egzekwowania i weryfikacji standardów bezpieczeństwa. Ten zdecentralizowany model zwiększa prawdopodobieństwo występowania rozbieżności w praktykach bezpieczeństwa, utrudniając zapewnienie zgodności wszystkich serwerów MCP z zasadami bezpiecznego rozwoju. Ponadto brak ujednoliconego systemu zarządzania pakietami dla serwerów MCP komplikuje instalację i konserwację, zwiększając prawdopodobieństwo wdrażania przestarzałych lub błędnie skonfigurowanych wersji. Korzystanie z nieoficjalnych instalatorów na różnych klientach MCP zwiększa zmienność wdrożeń serwerów, utrudniając utrzymanie spójnych standardów bezpieczeństwa. *Uwaga: Ta zmienność jest szczególnie uciążliwa w środowiskach wymagających ścisłej zgodności z przepisami.*

MCP nie posiada również ujednoliconej struktury do obsługi uwierzytelniania i autoryzacji kontrahentów, a także mechanizmu weryfikacji tożsamości lub regulacji dostępu. Bez tego trudno jest egzekwować szczegółowe uprawnienia. Ponieważ MCP nie posiada również modelu uprawnień i opiera się na OAuth, oznacza to, że sesja z narzędziem jest albo w pełni dostępna, albo ograniczona. Jak zauważa Andreessen Horowitz, wprowadzenie mnóstwa serwerów proxy i narzędzi doprowadzi do dodatkowej złożoności. Dlatego potrzebne będzie coś dodatkowego, a jednym z kandydatów na to jest tzw. Punkt Decyzji Polityki (PDP). Jest to komponent, który ocenia polityki kontroli dostępu. Biorąc pod uwagę dane wejściowe, takie jak tożsamość aktora, działanie, zasoby i kontekst, decyduje, czy zezwolić na operację, czy ją zablokować.

Mike Schwartz, założyciel startupu Gluu zajmującego się cyberbezpieczeństwem, podkreśla, że ​​chociaż punkty decyzyjne polityki (PDP) były wcześniej ciężką infrastrukturą działającą na serwerach lub komputerach mainframe, PDP wykorzystujące język polityki Cedar (open source) są wystarczająco małe i szybkie, aby działać w aplikacjach mobilnych i powinny ewoluować jako podstawowy komponent inteligentnych stosów sztucznej inteligencji. W 2024 roku AWS ogłosił składnię polityki Cedar po szeroko zakrojonych badaniach naukowych nad zautomatyzowanym rozumowaniem. Co ważne, Cedar jest deterministyczny – przy tych samych danych wejściowych zawsze otrzymuje się tę samą odpowiedź. Determinizm w bezpieczeństwie jest niezbędny do budowania zaufania, co wymaga ciągłego powtarzania tej samej czynności. Mike twierdzi, że osadzony PDP oparty na Cedar Spełnia wszystkie wymagania Dla inteligentnej sztucznej inteligencji.

Nowy początek z protokołem handlu automatycznego (MCP)

To nie jest kolejny biznes e-commerce. Wskazuje Jimmy SmithKiedy pytasz swojego agenta cyfrowego: „Znajdź mi hotel w Paryżu za mniej niż 400 dolarów z widokiem na Wieżę Eiffla”, nie po prostu wchodzi do Google i wyszukuje. Dołącza do zapytania Twoje dane uwierzytelniające (z portfela cyfrowego), preferencje dotyczące płatności, programy lojalnościowe itp., a także ograniczenia, takie jak cena maksymalna, zakresy dat i programy lojalnościowe. To „ustrukturyzowany ładunek kontekstowy”, który trafia do różnych serwisów turystycznych, które mogą odpowiadać i wchodzić w interakcję z Twoim agentem.

W przeciwieństwie do handlu elektronicznego, który powstał w internecie bez warstwy bezpieczeństwa (a zatem bez pieniądza cyfrowego ani tożsamości cyfrowej), handel zautomatyzowany (a-commerce) będzie oparty na infrastrukturze zapewniającej rzeczywiste bezpieczeństwo uczestnikom rynku. Stworzenie tej bezpiecznej infrastruktury stwarza ogromną szansę dla firm fintech i innych startupów, które chcą oferować pieniądz cyfrowy i tożsamość cyfrową jako kluczowe elementy. Dzięki ujednoliceniu mechanizmów identyfikacji, uwierzytelniania i autoryzacji w ramach protokołu handlu zautomatyzowanego (MCP), nie ma powodu, by nie oczekiwać, że handel zautomatyzowany (a-commerce) szybko przyspieszy na całym rynku.

Idź do góry przycisk