Jihokorejský technologický gigant Kakao chce kus akce v generativním závodu umělé inteligence a dnes o něj podal nabídku s velkými aktualizacemi svého generátoru obrázků AI Karlo a jeho velkého jazykového modelu KoGPT a také nového fondu na podporu. Starty generující obraz AI.
Divize AI společnosti Kakao Kakao Brain uvádí Karlo 2.0 – nástroj založený na umělé inteligenci, který dokáže vytvářet obrázky z textových výzev – uživatelům umožňuje generovat obrázek během několika sekund zadáním výzev v angličtině nebo korejštině.
KoGPT 2.0 mezitím nevyjde dříve než ve 3. čtvrtletí 2023, ale bude trénován na 30 miliardách různých parametrů.
Kakao Brain také založil Karlo 100X, fond ve výši 10 miliard wonů (7,7 milionu USD), aby podpořil začínající umělou inteligenci, které vyvíjejí technologii generování obrázků.
Vydání společnosti Kakao podtrhují tlak, kterému společnost, stejně jako všichni stávající technologickí hráči, čelí, aby držela krok s tempem pokroku v oblasti umělé inteligence: nováčci jako OpenAI, Midjourney a další udělali obrovský rozruch a kontrolovali vyprávění o největších inovacích. moment. Starším společnostem vždy hrozí nejen to, že nebudou vydělávat na tom, co přijde příště, ale začnou vypadat staře a zastarale.
Karlo 2.0 přichází pouhých sedm měsíců po předchozí aktualizaci společnosti (1.4). Kakao Brain již dříve vydal na GitHubu pokročilý generátor převodu textu na obrázek RQ-Transformer a minDALL-E.
Společnost tvrdí, že Karlo 2.0 je trénováno na 300 milionech textů a obrázků a podporuje maximální rozlišení 2048×2048, což vede k lepší kvalitě a jasnosti obrázků v různých stylech a velikostech. To je velký pokrok oproti dřívějším vydáním Karlo: Předchozí verze byla trénována na 180 milionech textových a obrazových datových bodů.
Karlo 2.0 bude také přívětivější pro vývojáře, s veřejně dostupným API pro vývojáře Kakao, které jim umožní přístup k vytváření 600 000 obrázků měsíčně zdarma.
Jeho předchůdce, nazývaný také KoGPT, byl původně uveden na trh v roce 2021 a natrénován na 200 miliardách tokenů na pouhých 6 miliardách parametrů s použitím korejských dat. V plánu je nyní přidat angličtinu, japonštinu a další asijské jazyky, včetně Bahasa Malajsie a vietnamštiny. Kakao Brain je naplánován na spuštění KoGPT 2.0 s 30 miliardami parametrů s cíli na třetí čtvrtletí roku 2023.
Poděkování za obrázky: Kakao mozek
Kakaovy tahy jsou zajímavé, ale nepřicházejí ve vzduchoprázdnu a budou čelit velké zavedené konkurenci. Generátory obrázků jsou již dostupné od OpenAI (ve formě DALL-E), Midjourney a Dream Studio Stable Diffusion. Zrovna minulý týden představil čínský technologický gigant Alibaba generativní model pro převod textu na obrázek Tongyi Wanxiang pro podnikové zákazníky.
Stejně jako v případě regionální vedoucí aplikace pro zasílání zpráv KakaoTalk se otevření pro společnost jako Kakao zdá být předním hráčem v obrázcích AI na svém trhu, spíše než cílem ovládnout svět. Začátkem tohoto roku Eun-Taek Hong, generální ředitel společnosti Kakao, ve své výdělečné zprávě uvedl, že korejská technologická společnost nabídne generativní služby AI. Ale spíše než soutěžit s globálními vrstevníky v této oblasti by Kakao vyvinul nabídky AI se zaměřením na korejský jazyk (prozatím), řekl Hong.
Bude také zajímavé sledovat, jak a jestli to Kakao vybuduje v tandemu se svými dalšími ambicemi v AI. Dělá například nájezd do zdravotnického průmyslu. Společnost vyvíjí nabídku generující umělou inteligenci pro analýzu lékařského obrazu a sepsání prvního návrhu diagnózy rentgenového snímku hrudníku pacienta pro lékaře. Vyvíjí také technologii AI pro objevování léků.
„Jsme potěšeni, že můžeme představit Karlo 2.0 prostřednictvím procesu učení se různým obrazovým datům a technologickému pokroku, včetně lidských proporcí a kompozice a perspektivních pohledů, které vyjadřují smysl pro prostor a trojrozměrnost,“ uvedl generální ředitel Kakao Brain Kim Ildoo. prohlášení. „Využijeme množství dat a zpětné vazby od uživatelů k vytvoření fotorealistických obrázků a zároveň vyvineme model generování obrázků, který dokáže uspokojit širší spektrum potřeb uživatelů.“
Dokonce i regionálně existuje spousta konkurence pro Kakao, přičemž další jihokorejské společnosti agresivně vyvíjejí své vlastní produkty AI, aby se utkaly o pozici v generativním prostoru AI.
Naver se chystá příští měsíc spustit generativní službu AI s názvem HyperCLOVA X a AI chatbota SearchGPT.
V prosinci 2021 LG AI Research, AI think-tank korejské technologické firmy LG, představil svůj velký jazykový model s umělou inteligencí nazvaný Exaone s možnostmi 300 miliard parametrů. Většina dceřiných společností LG, včetně LG Electronics, LG Energy Solution, LG U+ a LG Display, používá Exaone. Společnost LG Electronics vydala svého vlastního AI Chatbota v květnu v důsledku zablokování používání generativních nástrojů AI, jako je ChatGPT, Google Bard a Microsoft Bing AI.
A Samsung údajně vyvíjí soukromý generativní nástroj AI pro interní použití až poté, co omezí generativní nástroje AI po úniku citlivých dat.
SK Telecom, jedna z největších jihokorejských telco společností, také přidala technologii Chat GPT založenou na Azure OpenAI společnosti Microsoft do svého chatbota s umělou inteligencí s názvem A. [A dot]. Dvě z největších korejských telekomunikačních společností, KT a LG U+, vyvíjejí chatboty AI založené na technologii ChatGPT, podle místních médií.
Tento příběh byl aktualizován, aby odrážel, že KoGPT 2.0 nebude založen na GPT-3.5 OpenAI.