LT · · 5 min. skaitymo

Gemini 3.5 Flash įdiegta pirmąją dieną, ES rezidencija išlaikyta

Dultra įdiegė Google Gemini 3.5 Flash visuotinio prieinamumo dieną. Migracijos apimtis, išmatuotas poveikis ir suvereni ES tiekimo praktika.

produktasinfrastruktūraAIES duomenų rezidencijaGeminikorporatyvinis EN Read in English

Vykdomoji santrauka. 2026 m. gegužės 19 d., Google paskelbus Gemini 3.5 Flash visuotinį prieinamumą, Dultra užbaigė feature-flag valdomą migraciją į naują modelį visose klientų organizacijose ne realaus laiko samprotavimo darbo krūviams. Vertinimo po skambučio latencija sumažėjo nuo 11,2 sekundės iki 4,7 sekundės. Sąnaudos vienam vertinimui sumažėjo 47%. Visa ES duomenų rezidencija išliko nepažeista — joks inferenco srautas migracijos metu nepaliko Europos Sąjungos. Realaus laiko garso kelias ir pokalbio metu veikiantis koučas, kurie naudoja atskirai sukonfigūruotą lite inferenco profilį, sąmoningai liko nepakeisti.

Platformos leidimas

Šįryt Google paskelbė Gemini 3.5 Flash — naujausią modelį savo „frontier” šeimoje. Su leidimu paskelbti pagrindiniai testų rezultatai — Terminal-Bench 2.1: 76,2%, GDPval-AA: 1656 Elo, MCP Atlas: 83,6% ir CharXiv Reasoning: 84,2% — viršija Gemini 3.1 Pro daugelyje kodavimo ir agentinio samprotavimo testų. Kartu modelis pasiekia maždaug keturis kartus didesnį išvedimo žetonų pralaidumą nei panašaus lygio kiti modeliai, mažiau nei pusės jų inferenco kainos. Google nustatė 3.5 Flash kaip numatytąjį modelį Gemini programėlei, AI režimui Google paieškoje ir Gemini Enterprise Agent Platform.

Dultra atveju 3.5 Flash dabar yra samprotavimo pagrindas po kiekviena analitine ir generavimo funkcija, vykdoma už realaus laiko garso ciklo ribų.

Migracijos apimtis

Dultra platforma atskiria inferenco kelią į du atskirus srautus. Kiekvienas šiame leidime buvo traktuojamas atskirai.

Realaus laiko pokalbio kelias — sąmoningai nepakeistas. Tiesioginis pokalbis tarp pardavimų atstovo ir AI kliento, taip pat pokalbio metu veikiantis koučo sluoksnis, naudoja atskirai sukonfigūruotą profilį, parinktą dėl sub-sekundinio atsako kiekvienam pokalbio žingsniui. Abu komponentai prieš leidimą atitiko nustatytus paslaugos lygio tikslus, ir mes sąmoningai nusprendėme jų neperkelti į 3.5 Flash: tai nebūtų suteikę vartotojo juntamo pagerėjimo prie tos kainos struktūros, kurios reikalauja gyvas srautas. Pokalbio metu juntama latencija liko vienoda prieš ir po leidimo.

Ne realaus laiko samprotavimo paviršiai — perkelta į 3.5 Flash. Visi analitiniai ir generavimo darbo krūviai, esantys už pokalbio ribų, buvo perkelti vienu koordinuotu leidimu. Tai apima vertinimą po skambučio ir tekstinę santrauką, kontrafaktinį samprotavimą („ką galėjote pasakyti vietoj to”), simuliacijų autorystę administratoriams, reguliuojamo lygio transkriptų peržiūrą atitikties ir klaidinančio pardavimo taisyklių rinkiniams ir automatinį koučingo plano sintezavimą.

Išmatuotas poveikis

Žemiau pateikti rodikliai surinkti per reprezentatyvią klientų simuliacijos sesijų imtį ir su jomis susijusių po skambučio samprotavimo iškvietimų migracijos lange.

RodiklisAnkstesnė kartaGemini 3.5 FlashPokytis
Pokalbio metu juntama latencija (gyvas pokalbio kelias)bazinisnepasikeitėbe pokyčio
Vertinimo latencija po skambučio (mediana, 30 min sim)11,2 s4,7 s−58%
Sąnaudos vienam vertinimuibazinis−47%−47%
Atitikties peržiūros pralaidumas, pilnos organizacijos transkriptaibazinis~3,7×+274%
Vertinimo ištikimybė rubrikai (vs. ekspertas žmogus, „aklas” testas)81%89%+8 b.
Daugiapakopių vertinimo grandinių užbaigta be įsikišimon/d94%nauja geba

Du rezultatai vertini ypatingo dėmesio.

Pirma, samprotavimas po skambučio peržengė vartotojo suvokimo slenkstį. Kur ankstesnė karta reikalavo, kad atstovas lauktų vertinimo rezultatų, 3.5 Flash grąžina ataskaitą, citatų rinkinį, kontrafaktinį transkriptą ir atitikties peržiūrą anksčiau, nei atstovas paprastai uždaro simuliacijos sąsają. Po skambučio patirtis nebėra delsa; ji yra simuliacijos dalis.

Antra, migracija įgalina agentinį vertinimą, kuris anksčiau nebuvo praktiškai įmanomas gamyboje. Vertinimas perdarytas iš vieno prompto atsako į daugiapakopę samprotavimo grandinę, kuri įvertina kiekvieną rubrikos skiltį atskirai, sukryžmina rezultatus dėl vidinio nuoseklumo ir sukuria galutinę santrauką. Gemini 3.5 Flash šią grandinę išlaiko be pakartojimų 94% atvejų. Su ankstesne modelio karta tas pats darbo eigos srautas reikalavo gerokai daugiau orkestracijos pridėtinių sąnaudų.

Atitikties peržiūra taip pat įžengė į kitokį operacinį režimą. Pralaidumo pagerėjimas leidžia siūlyti realaus laiko atitikties stebėjimo skydelius pilnoms organizacijos transkriptų istorijoms be papildomos apatinės talpos plėtros — esminis struktūrinis pokytis mūsų reguliuojamų pramonių klientams.

ES duomenų rezidencija

Dultra veikia išskirtinai suverenios Europos Sąjungos infrastruktūros viduje, su pagrindiniu ir atsarginiu inferenco regionais ES teritorijoje. Gemini 3.5 Flash prieinamumas mūsų nustatytuose regionuose buvo užtikrintas dar prieš migracijos langą. Joks kliento garsas, transkriptas, embeddinas ar gauti artefaktai migracijos metu nekirto ne-ES regiono ir nedarys to nuolatiniame veikime.

Dultra klientams reguliuojamose pramonėse — bankininkystėje, draudimo brokeriuose, NT, sveikatos priežiūros gretimose — suvereniai ES sąlygos yra viešųjų pirkimų sąlyga, ne papildomas patobulinimas. Mes ir toliau veikiame be architektūrinių išimčių šioje srityje, įskaitant ir modelio atnaujinimo metu.

Dalyvavimas ankstyvojoje prieigoje

Dultra šiais metais buvo priimta į Vertex AI Gemini 3.5 privačios peržiūros programą ir tarpinį laikotarpį panaudojo modelio patikrai prieš mūsų gamybinį darbo krūvį atspindinčius profilius ir prieš kontroliuojamą pasirinkusių klientų organizacijų grupę. Šiandien įvykdyta migracija atspindi išrepetuotą planą — etapinį išleidimą, automatinį grįžimą sveikatos patikros nesėkmės atveju, pilną stebėseną nuo galo iki galo — ir vyko be neplanuotų prastovų bei be klientų praneštų regresijų. Likusios ankstyvosios prieigos sutarties detalės, partnerio pageidavimu, lieka konfidencialios.

Pasekmės kelio žemėlapiui

Trys šiuo metu kuriami punktai, kurių kiekvieną įgalina arba pagreitina 3.5 Flash:

  1. Lenkų kalbos analitinis sluoksnis — šiuo metu staging’e, viešas prieinamumas suplanuotas šio mėnesio pabaigoje. Pagerėjusi 3.5 Flash samprotavimo kokybė lenkų kalboje, istoriškai sunkus taikinys ankstesnėms Gemini kartoms, užbaigia analitinę gebą, reikalingą įžengti į Lenkijos įmonių rinką tame pačiame operaciniame pagrinde.
  2. Išplėstas kontrafaktinis samprotavimas — alternatyvinio transkripto rezultatas dabar įtraukia pilną pirkėjo profilį ir kliento įkeltą žinių bazę, ne tik vietinį pokalbio segmentą. Įmanoma dėl 3.5 Flash agentinės gebos.
  3. Automatinis koučingo plano sintezavimas — pardavimų vadovai galės užklausti struktūrizuotų, daugiasavaitių koučingo planų, sukurtų iš atstovo neseniai vykusių simuliacijų istorijos. Akivaizdžiai nepasiekiama ankstesnėje modelio kartoje; veikia tiksliniame režime šioje.

Komercinės pasekmės

47% sumažėjusios kompiuterio sąnaudos antroje pagal dydį mūsų infrastruktūros išlaidų eilutėje toliau praplečia ir taip palankią bruto maržos poziciją. Kartu su mūsų esama kainodara — fiksuota licencija už vietą su neribota praktikos naudojimo apimtimi — toks sąnaudų pokytis įgalina komercinius mechanizmus, kurių konkurentai, dirbantys standartiniu inferenco įkainiu, struktūriškai pasiūlyti negali: ilgesnius bandomuosius laikotarpius, į rezultatą orientuotas komercines garantijas ir daugiamečius kainos užfiksavimus klientui patraukliomis sąlygomis.

Dultra nepritaikys šių sutaupytų lėšų kaip mažesnės kainos sąraše. Sutaupytos lėšos bus reinvestuotos į klientų pritraukimą, reguliuojamų pramonių sertifikavimo darbus ir platformos partnerystės programą, sukūrusią šį pranašumą. Pirmosios dienos pristatymas „frontier” modelio leidime yra operacinis tempas, kurį palaikome savo klientų ir investuotojų vardu. Tikimės jį palaikyti ir tolesniuose leidimuose.

Susiję straipsniai