Operator to przeglądarka internetowa, po której porusza się ChatGPT na przykład wtedy, gdy chcemy zarezerwować stolik w ulubionej restauracji. Bot od OpenAI po prostu wykonuje identyczny proces, który normalnie musielibyśmy zrobić sami. Wchodzi na stronę restauracji, rozpoznaje pola formularza, wprowadza w nich odpowiednie dane i wysyła je do lokalu.
To świetne rozwiązanie, gdy nie możemy użyć rąk, bo prowadzimy samochód albo gotujemy, lub gdy jesteśmy w biegu i nie mamy czasu na wykonanie czynności, którą ChatGPT jest w stanie zrealizować bez problemu. W końcu czas to pieniądz, więc zamiast samemu zamawiać swojego ulubionego Big Maca przez aplikację Uber Eats, możemy poprosić o zrobienie tego samego bota od OpenAI.
Operator wydaje się być ciekawą alternatywą dla asystentów umawiających spotkania, ogarniających podróże, rezerwujących hotele czy ogólnie wykonujących powtarzalną robotę. Na demonstracji ChatGPT jest proszony o zarezerwowanie najlepiej ocenianej jednodniowej wycieczki po Rzymie w serwisie TripAdvisor. Ten otwiera więc stronę usługi, wybiera odpowiednią kategorię, korzysta z wyszukiwarki, zamyka pop-upy, stosuje filtry, ustawia sortowanie i gotowe.
Operator to nasz pierwszy agent AI, który jest w stanie działać bez Twojej ingerencji – podaje OpenAI. – Dajesz mu zadanie, a on je wykonuje.
Usługa na razie jest dostępna wyłącznie w kosztującym 200 dolarów miesięcznie planie Pro, w Stanach Zjednoczonych. OpenAI tłumaczy to bezpiecznym wdrażaniem usługi. Chcą zrobić to w najwęższym gronie, jednocześnie zbierając jak najwięcej danych dobrej jakości. Takich danych OpenAI nie uzyska od klientów planów Team czy Enterprise, nie mniej po odpowiednim przetestowaniu i polepszeniu usługi trafi ona zarówno do nich, jak i do użytkowników planu Plus.
Operator działa na bazie modelu CUA i możliwości wizyjnych GPT-4o. Może wykonywać kilka czynności jednocześnie, a użytkownik w każdym momencie może przejąć kontrolę nad jego działaniem. Ponadto Operator jest wyuczony, by prosić użytkownika o reakcję, gdy utknie w sytuacji bez wyjścia, bo na przykład nie będzie w stanie rozwiązać zbyt skomplikowanej dla niego CAPTCHY albo potrzebne będą dodatkowe dane, na przykład karty płatniczej lub logowania.
ChatGPT tak jak dotychczas uczy się użytkownika, więc wykonując powtarzalne czynności, z czasem wymaga mniejszej liczby instrukcji. W końcu wie, że użytkownik lata tylko United Airlines, śpi tylko w pięciogwiazdkowych hotelach i kupuje wyłącznie majonez Winiary.
Operator może budzić wątpliwości dotyczące bezpieczeństwa, ale OpenAI już je rozwiewa. Usługa rozpoznaje więc ukryte na stronie elementy i ignoruje je lub natychmiastowo przerywa swoje działanie i informuje użytkownika, gdy wykryje coś podejrzanego. Mówimy tu na przykład o osadzonych na stronie promptach mających wpłynąć na AI albo próby phishingu.