Na Google I/O 2025 sve je u znaku veštačke inteligencije – Gemini 2.5, Imagen 4, Veo 3, AI alat za filmove… Ovogodišnja konferencija donela je niz važnih najava, sa jasnim fokusom na generativnu veštačku inteligenciju.
Predstavljene su nove verzije Gemini 2.5 (Pro, Flash) i značajna unapređenja Imagen 4 (generisanje slika) i Veo 3 (generisanje videa). Google je najavio i Flow, specijalizovani AI alat za kreiranje filmskih scena. Ovaj alat kombinuje Gemini, Imagen i Veo modele, a sve na osnovu jednostavnih tekstualnih opisa korisnika.
Gemini 2.5: Više jezika i konteksta, bolje rezonovanje
Modeli Gemini 2.5 sada podržavaju više od 24 jezika, uključujući pretvaranje teksta u govor i izražajne glasove. Nažalost – srpski jezik nije među njima. Pošto dokumentacija nije baš najjasnija pitali smo direktno Gemini na HONOR 400 telefonu da nam to razjasni. Ne, Google Gemini 2.5 Pro i Flash ne podržava srpski jezik još uvek 😉



Google navodi poboljšanja u oblasti rezonovanja, multimodalnosti, programiranja i razumevanja dužeg konteksta, kako za Pro, tako i za Flash varijantu.
Najveća novina Gemini 2.5 Pro modela je Deep Think – eksperimentalni režim namenjen rešavanju složenih matematičkih i programerskih zadataka. Ova funkcija omogućava modelu da razmatra više hipoteza pre nego što odgovori. Google najavljuje da će uskoro biti dostupna odabranim test korisnicima.


Gemini 2.5 Pro trenutno prednjači na WebDev Arena i LMArena testovima, zahvaljujući naprednim alatima za kodiranje i razvoj veb aplikacija, kao i podršci za do milion tokena konteksta. Dodatno je poboljšana zaštita od indirektnih prompt-injection napada.
Gemini 2.5 Flash je već dostupan svima u Gemini aplikaciji, dok se puna dostupnost očekuje tokom juna. Komercijalna verzija Gemini 2.5 Pro stiže ubrzo nakon toga.
Imagen 4: Bolja rezolucija, bolji tekst
Nov model za generisanje slika, Imagen 4, sad može da isporuči slike 2K rezolucije. Poboljšana je tačnost prikaza teksta u generisanim karticama, posterima i stripovima. Imagen 4 je 21. maja stigao u Gemini App, Google Workspace, Whisk i Vertex AI.

Veo 3: Video sa zvukom i dijalogom
Veo 3 je najnoviji Google AI model za generisanje videa, sa znatno poboljšanim razumevanjem tekstualnih opisa. Može da generiše video klipove sa zvukom, dijalozima likova i ambijentalnom pozadinom. Dostupan je korisnicima Google AI Ultra pretplatničkog plana u SAD, kao i poslovnim korisnicima na Vertex AI platformi.
Takođe, prethodna verzija Veo 2 dobija funkcije za pokrete kamere, kao i dodavanje i uklanjanje objekata. Korisnici mogu da dodaju slike radi kontrole stila, kao i da koriste outpainting za proširenje kadrova izvan originalnih granica.
Flow: AI alat za režiju i montažu
Google je predstavio Flow, novi alat zasnovan na veštačkoj inteligenciji za filmsko stvaralaštvo. Ovaj sistem koristi moć modela Veo, Imagen i Lyria kako bi omogućio generisanje realističnih, fizički uverljivih i vizuelno impresivnih scena. Flow omogućava korisnicima da kontrolišu pokrete kamere, uglove i perspektivu, kao i da uređuju i proširuju prethodno generisane video zapise.
Flow je dostupan Google AI Pro i Ultra korisnicima u SAD. Saznajte više na blogu.

