Na výroční konferenci Inspire společnost Microsoft oznámila řadu nových funkcí umělé inteligence zamířených do Azure, z nichž možná nejpozoruhodnější je Vector Search. Vector Search, který je k dispozici v náhledu prostřednictvím Azure Cognitive search, využívá strojové učení k zachycení významu a kontextu nestrukturovaných dat, včetně obrázků a textu, aby bylo vyhledávání rychlejší.
Vektorizace, stále populárnější technika ve vyhledávání, zahrnuje převod slov nebo obrázků na vektory nebo řady čísel, které kódují jejich význam – což umožňuje jejich matematické zpracování. Vektory umožňují strojům strukturovat data a dávat jim smysl, což jim umožňuje například pochopit, že slova blízko sebe ve „vektorovém prostoru“ – jako „král“ a „královna“ – spolu souvisí a rychle je vynoří z databáze milionů slova.
Společnosti jako Qdrant a SeMI Technologies využívají vektorové vyhledávání k napájení svých databázových služeb, stejně jako tech giganti jako Amazon a Google.
Příchuť vektorového vyhledávání společnosti Microsoft nabízí „čisté“ vyhledávání vektorů, hybridní vyhledávání a „důmyslné“ přehodnocení. Společnost poznamenává, že jej lze použít v aplikacích a službách ke generování personalizovaných odpovědí v přirozeném jazyce, poskytování doporučení k produktům a identifikaci vzorců dat.
„Vyhledávání vektorů je integrováno s Azure AI, což zákazníkům umožňuje vytvářet aplikace s podporou vyhledávání, založené na chatu, převádět obrázky na vektorové reprezentace pomocí Azure AI Vision. [and] získávat relevantní informace z velkých datových sad, které pomáhají automatizovat procesy a pracovní postupy,“ píše společnost v příspěvku na blogu. „Integrace vektorového vyhledávání se plynule rozšiřuje na další možnosti Azure Cognitive Search, včetně fasetové navigace, filtrů a dalších.
Jinde v Azure spouští Microsoft řešení, které nazývá Document Generative AI, které integruje stávající služby Microsoftu pro zpracování dokumentů založené na AI, včetně Azure Form Recognizer, se službou Azure OpenAI. (Připomeňme, že Azure OpenAI Service je plně spravovaná nabídka společnosti Microsoft zaměřená na podniky navržená tak, aby podnikům poskytla přístup k technologiím umělé inteligence od OpenAI – se kterou má Microsoft úzké komerční partnerství – s přidanými ovládacími prvky a funkcemi správy.)
Řešení AI pro generování dokumentů – využívající nejnovější jazykové modely AI OpenAI – ingestuje soubory pro úkoly, jako je sumarizace sestav, extrakce hodnot, dolování znalostí a generování nových typů dokumentů. V podstatě umožňuje společnosti vytvořit aplikaci, jako je ChatGPT OpenAI, která dokáže číst dokumenty a používat tyto dokumenty jako základ pro své odpovědi.
Například pomocí AI pro generování dokumentů může zákazník nahrát faktury, účty a smlouvy, aby zaměstnanci mohli klást otázky týkající se záruk služeb a konkrétních řádkových položek. Řešení Document Generative AI odpovídá na otázky v textu i v obrázcích a tabulkách a poskytuje citace s odkazem na zdrojový obsah.
Microsoft vysvětluje:
“[Using the Document Generative AI solution, you can] interagujte s dokumenty pomocí přirozeného jazyka a generujte nový obsah ze svých stávajících dokumentů, včetně blogových příspěvků, informačních bulletinů, souhrnů a titulků… Ať už potřebujete inteligentní možnosti chatování s dokumenty, pomoc při psaní, podporu dotazů, komplexní funkce vyhledávání nebo dokonce překlad dokumentů, AI pro generování dokumentů dokáže zvládnout složité a různorodé úlohy s dokumenty prostřednictvím modelů z OpenAI.“
V souvisejícím oznámení Microsoft odhalil, že model Whisper od OpenAI, model automatického rozpoznávání řeči, brzy přijde do služby Azure OpenAI a také do rodiny řečových služeb AI společnosti Microsoft. Podnikoví zákazníci budou moci používat Whisper k přepisu a překladu zvukového obsahu a také k vytváření dávkových přepisů „ve velkém měřítku,“ říká Microsoft.
Společnost Microsoft završila odhalení umělé inteligence na veletrhu Inspire a oznámila veřejnou ukázku Real-time Diarization, řečové služby řízené umělou inteligencí, která dokáže identifikovat, kteří z několika lidí mluví v reálném čase. Společnost také oznámila širší dostupnost Custom Neural Voice, který využívá AI, aby přesně reprodukoval hlas herce nebo vytvořil originální syntetický hlas.
Dříve měl Custom Neural Voice omezenější přístup. Aby jej zákazníci mohli používat, musí o to požádat a být schváleni společností Microsoft.
Aby se lidé neobávali potenciálu deepfakes, Microsoft říká, že Custom Neural Voice obsahuje ovládací prvky, které pomáhají zabránit zneužití služby. Když zákazník odešle nahrávku, hlasový herec – pokud je používán – musí učinit prohlášení, v němž potvrdí, že rozumí technologii a je si vědom, že si zákazník nechává vytvořit hlas. Nahrávka je poté porovnána prostřednictvím ověření mluvčího, aby se zajistilo, že se hlasy shodují, než může zákazník začít vytvářet hlas.
Společnost Microsoft také smluvně vyžaduje, aby zákazníci získali souhlas od hlasových talentů, a zákazníci musí souhlasit s kodexem chování, než mohou začít používat Custom Neural Voice. Kromě toho společnost Microsoft nabízí nástroje pro vodoznaky a detekci, jejichž cílem je usnadnit identifikaci, zda byl daný zvukový klip vytvořen pomocí Custom Neural Voice.
Tyto ovládací prvky, za předpokladu, že fungují tak, jak jsou inzerovány, nutně nevyřeší spory týkající se licencí a souhlasu kolem technologie hlasového klonování. Ale Microsoft se evidentně rozhodl, že to není jeho boj.