Velké jazykové modely (LLM), jako je OpenAI GPT-4, jsou výkonné nástroje pro změnu paradigmatu, které slibují, že oživí průmyslová odvětví. Trpí však omezeními, která je činí méně atraktivními pro podnikové organizace s přísnými požadavky na dodržování předpisů a řízení. Například LLM mají tendenci vytvářet informace s vysokou spolehlivostí a jsou navrženy tak, že je obtížné odstranit – nebo dokonce revidovat – jejich znalostní základnu.
Aby vyřešil tyto a další překážky, Douwe Kiela spoluzaložil Contextual AI, která se dnes spustila z tajnosti s počátečním financováním 20 milionů dolarů. S podporou investorů, včetně Bain Capital Ventures (která vedla semeno), Lightspeed, Greycroft a SV Angel, se Contextual AI ambiciózně zaměřuje na vybudování „nové generace“ LLM pro podnik.
„Společnost jsme vytvořili, abychom reagovali na potřeby podniků v rozvíjející se oblasti generativní umělé inteligence, která se dosud převážně zaměřovala na spotřebitele,“ řekla Kiela e-mailu TechCrunch. „Kontextová umělá inteligence řeší několik překážek, které dnes existují při přimět podniky, aby přijaly generativní umělou inteligenci.“
Kiela a další spoluzakladatel Contextual AI, Amanpreet Singh, spolupracovali na AI startupu Hugging Face and Meta, než se začátkem února rozhodli jít do toho sami. Ve společnosti Meta vedla Kiela výzkum techniky zvané retrieval augmented generation (RAG), která tvoří základ technologie kontextové umělé inteligence generující text.
Takže co je RAG? Stručně řečeno, RAG – kterou také prozkoumala divize výzkumu a vývoje DeepMInd společnosti Google – rozšiřuje LLM o externí zdroje, jako jsou soubory a webové stránky, aby se zlepšil jejich výkon. Na výzvu (např. „Kdo je prezidentem USA?“) hledá RAG data ve zdrojích, která by mohla být relevantní. Poté sbalí výsledky s původní výzvou a předá je LLM, čímž vygeneruje „kontextovou“ odpověď (např. „Současným prezidentem je Joe Biden, podle oficiálních webových stránek Bílého domu“).
Naproti tomu v odpovědi na otázku typu „Jaký je HDP Nepálu v jednotlivých letech?“ může typický LLM (např. ChatGPT) vrátit HDP pouze k určitému datu a neuvést zdroj informací.
Kiela tvrdí, že RAG může vyřešit další nevyřešené problémy s dnešními LLM, jako jsou ty kolem atribuce a přizpůsobení. U konvenčních LLM může být obtížné zjistit, proč modely reagují tak, jak reagují, a přidání zdrojů dat do LLM často vyžaduje přeškolení nebo jemné doladění – kroky, kterým se (obvykle) s RAG vyhnout.
„Jazykové modely RAG mohou být menší než ekvivalentní jazykové modely a stále dosahují stejného výkonu. Díky tomu jsou mnohem rychlejší, což znamená nižší latenci a nižší náklady,“ řekla Kiela. „Naše řešení řeší nedostatky a zděděné problémy stávajících přístupů. Věříme, že integrace a společná optimalizace různých modulů pro integraci dat, uvažování, řeč a dokonce vidění a poslech odemkne skutečný potenciál jazykových modelů pro případy podnikového použití.
Můj kolega Ron Miller přemítal o tom, jak by budoucnost generativní umělé inteligence v podniku mohla být menší, více zaměřené jazykové modely. To nezpochybňuji. Možná však namísto výlučně vyladěných LLM zaměřených na podnik půjde o kombinaci „menších“ modelů a stávajících LLM doplněných o množství dokumentů specifických pro společnost.
Kontextová umělá inteligence není první, kdo tuto myšlenku prozkoumal. OpenAI a jeho blízký partner, Microsoft, nedávno spustili zásuvný modul, který umožňuje třetím stranám přidávat zdroje informací do LLM, jako je GPT-4. Jiné startupy, jako je LlamaIndex, experimentují se způsoby, jak vložit osobní nebo soukromá data, včetně podnikových dat, do LLM.
Ale kontextová umělá inteligence tvrdí, že má v podniku průniky. Zatímco společnost má v současnosti předvýdělky, Kiela tvrdí, že Contextual AI jedná se společnostmi z Fortune 500 o pilotování její technologie.
„Podniky si musí být jisti, že odpovědi, které dostávají z generativní umělé inteligence, jsou přesné, spolehlivé a sledovatelné,“ řekla Kiela. „Kontextová umělá inteligence usnadní zaměstnavatelům a jejich pracovníkům s cennými znalostmi získat výhody efektivity, které může generativní umělá inteligence poskytnout, a přitom to bude dělat bezpečně a přesně… Několik společností zabývajících se generativní umělou inteligencí uvedlo, že budou prosazovat podnikový trh, ale kontextová umělá inteligence jiný přístup vytvořením mnohem integrovanějšího řešení zaměřeného speciálně na případy podnikového použití.“
Kontextová umělá inteligence, která má přibližně osm zaměstnanců, plánuje utratit většinu svého počátečního financování na vývoj produktů, což bude zahrnovat investice do výpočetního clusteru pro školení LLM. Společnost plánuje do konce roku 2023 zvýšit počet zaměstnanců na téměř 20 lidí.