Teraz możesz przesyłać i edytować zdjęcia w Gemini.

Specjalistyczne:

Możesz teraz przesyłać i edytować zdjęcia w Gemini za darmo. Funkcja ta jest stopniowo udostępniana wszystkim użytkownikom, począwszy od dziś.
Użytkownicy mogą również tworzyć i edytować obrazy AI w Gemini za pomocą konwersacyjnych komunikatów tekstowych.
Google potwierdza, że wszystkie obrazy generowane przez sztuczną inteligencję w systemie Gemini będą miały widoczny znak wodny i niewidoczny cyfrowy znak wodny SynthID.

Wreszcie, Google wprowadza możliwość edycji obrazów w Gemini za pomocą komunikatów tekstowych. Możesz teraz przesyłać istniejące obrazy i edytować je w Gemini za pomocą konwersacji tekstowych. Dodatkowo, możesz tworzyć obrazy wspomagane sztuczną inteligencją w Gemini i kopiować je w celu modyfikacji. Funkcja edycji obrazów w Gemini jest stopniowo udostępniana wszystkim użytkownikom, począwszy od dziś. Ta nowa funkcja usprawnia komfort użytkowania i zapewnia potężne narzędzia kreatywne.

Google jako pierwszy zademonstrował natywną edycję obrazów z wykorzystaniem modelu Gemini 2.0 Flash w AI Studio. Testowałem ten model w lutym i byłem pod wrażeniem, jak łatwo umożliwił on konwersacyjną edycję obrazów. W odpowiedzi na natywny model generowania obrazów Google, OpenAI wprowadził również natywną edycję i generowanie obrazów w ChatGPT.

Doprowadziło to do Trend Ghibli Co szybko się rozprzestrzeniło i zwiększyło wykorzystanie ChatGPT. Teraz Google wprowadziło możliwość edycji natywnych obrazów do swojej aplikacji konsumenckiej Gemini. Warto zauważyć, że można edytować obrazy zarówno w aplikacji mobilnej Gemini, jak i w przeglądarce. Ta funkcja czyni Gemini silnym konkurentem w dziedzinie generatywnej sztucznej inteligencji.

Ponieważ porównałem Natywna edycja obrazów pomiędzy ChatGPT i GeminiMogę powiedzieć, że Gemini znacznie lepiej zachowuje spójność postaci/scen między generacjami. ChatGPT zmienia ogólny obraz po każdej generacji, podczas gdy Gemini jest bardzo spójny. Jednak w generowaniu obrazu ChatGPT przewyższa Gemini. Odzwierciedla to różnice w architekturze używanych modeli.

Teraz musimy się dowiedzieć, czy Google nadal korzysta z modelu opartego na dyfuzji Imagen 3 do generowania obrazów, czy też z natywnych możliwości generowania obrazów modeli Gemini. Nawiasem mówiąc, OpenAI wykorzystuje model sztucznej inteligencji GPT-4o do generowania i modyfikowania obrazów. Ten rozwój sytuacji pokazuje trwającą konkurencję w dziedzinie sztucznej inteligencji.

Ponadto Google twierdzi, że wszystkie obrazy utworzone lub zmodyfikowane za pomocą Gemini będą opatrzone niewidocznym cyfrowym znakiem wodnym SynthID. Google doda również widoczny znak wodny do wszystkich obrazów utworzonych za pomocą Gemini. Ten środek ma na celu promowanie przejrzystości i rozliczalności w zakresie wykorzystania sztucznej inteligencji.

Gemini