Dumme, startup, který AI prakticky využívá při střihu videa, již generuje poptávku, než se otevře veřejnosti. Společnost podporovaná Y Combinator má stovky tvůrců videí, kteří testují její produkt, který využívá umělou inteligenci k vytváření krátkých videí z obsahu YouTube, a seznam čeká více než 20 000 před spuštěním. Při použití kombinace vlastních i stávajících modelů umělé inteligence Dumme slibuje, že nejen ušetří čas na úpravy, ale také – a zde je jeho velký nárok – odvede lepší práci než smluvní (lidská) pracovní síla, která má často za úkol podřadnější práci. Úlohy úpravy videa, jako je ořezávání dlouhého obsahu pro publikování na platformách krátkého formátu, jako jsou YouTube Shorts, TikTok nebo Instagram Reels.

Spoluzakladatel a generální ředitel společnosti Dumme Merwane Drai, který byl založen v lednu 2022 a je účastníkem startovacího akcelerátoru Y Combinator’s Winter 2022, uvedl, že se původně zaměřoval na vytvoření vyhledávače pro video. Ale asi před šesti měsíci si tým uvědomil, že lepším produktem by mohlo být použití stejných modelů umělé inteligence, které vyvíjeli, k úpravě videoklipů.

Drai, ke kterému se připojili spoluzakladatelé Will Dahlstrom (CPO) a Jordan Brannan (CTO), všichni se zkušenostmi s umělou inteligencí, si uvědomil, že Dumme mohl přistát na správném trhu produktů poté, co se jejich aplikace stala virální a zhroutila jejich servery.

„Opravdu jsme nečekali, že to bude mít hodně trakce nebo tak něco, tak jsme tam prostě něco dali,“ vysvětluje Drai. “Pak se stalo to, že jsme se přes noc probudili s přetíženými servery – jako by vlastně nic nefungovalo.” Takže jsme všechno sundali a vlastně dali dohromady nějaký pořadník,“ pokračuje. “Druhý den ráno jsme tam pravděpodobně probudili až 5 000 lidí, což bylo zajímavé.”

Tým později zjistil, že tvůrce TikTok zveřejnil krátké video o produktu, které na jejich stránky vyslalo záplavu návštěvnosti.

“Ve skutečnosti se to nikdy neuklidnilo,” poznamenává Drai.

Produkt, vyslovovaný jako „figurína“, se tvůrcům líbil, protože si kladl za cíl zjednodušit a urychlit práci spojenou s úpravou videa.

Poděkování za obrázky: Dumme

Použití Dumme je tak jednoduché, jak název napovídá. Začněte tím, že uživatel vloží odkaz na video na YouTube, poté klikne na „generovat“ a AI vytvoří několik krátkých videí, která představí nejdůležitější body z tohoto přijatého obsahu. Společnost tvrdí, že používá YouTube jako zdroj namísto podpory nezpracovaných videozáznamů, aby mohla zadávat moderování obsahu – to znamená, že pokud je to povoleno na YouTube, je to povoleno v Dumme.

Doba zpracování a počet výsledných klipů bude záviset na délce původního videa.

Ale například hodinový video podcast může trvat asi 20 minut a vy začnete přijímat klipy asi po pěti minutách, říká Drai. Po dokončení si mohou tvůrci stáhnout videoklipy, které jsou ve výchozím nastavení kratší než 60 sekund, a nahrát je na jakoukoli platformu, která podporuje krátký obsah, jako jsou YouTube Shorts, ale také na jiné platformy, jako jsou Reels nebo TikTok.

Poděkování za obrázky: Dumme

Jak to všechno funguje na zadní straně, je samozřejmě mnohem složitější. Společnost říká, že zpočátku se Dumme naučí co nejvíce ze zdrojového videa prostřednictvím metadat. Poté přepíše video a pokusí se porozumět sémantice toho, co je řečeno, a zároveň se podívá na snímky, aby se pokusil dekódovat emoce mluvící osoby. Tato zjištění jsou korelována a předávána jazykovému modelu, který se snaží určit, které části videa jsou hodné oříznutí. To je pak předáno jinému modelu, který sleduje aktivní reproduktory a řeší oříznutí.

Dumme říká, že pracuje se stávajícími modely umělé inteligence, jako je GPT-4, vyladěná verze Whisper a další, které si vytvořil interně – jako model, který sleduje aktivní reproduktory ve videu. Jeden z jeho modelů je také trénován na spoustě krátkých videí YouTube, aby se naučil, co tvoří dobrý úvodní háček, který přitáhne diváky. A i když to ještě není živé, tým také experimentuje s modelem s otevřeným zdrojovým kódem, LaViLa z Facebook Research, abyste lépe pochopili kontext videa.

Práce s umělou inteligencí se provádí na poskytovateli cloudu GPU CoreWeave, nikoli na AWS, protože je cenově dostupnější, říká společnost.

Protože Dumme spoléhá na AI, která zpracovává mluvená slova, tato technologie není vhodná pro věci, jako jsou dlouhá herní videa nebo jiné, kde lidé nemluví. Drai říká, že startup se zpočátku zaměřuje na tvůrce YouTube, podcastery a agentury – ty druhé by podle nich byly nejlepší sázkou pro zpeněžení produktu.

Poděkování za obrázky: Dumme

Agentury, vysvětluje Drai, dnes často outsourcují tento typ práce s výsledky typu hit-or-miss.

„Jen platí dodavatelům v levných jurisdikcích za úpravu jejich vlastního obsahu. A problém je v tom, že je to vlastně stále dost drahé a zabere to spoustu času – trvá to týdny, ne minuty,“ říká.

Na otázku, jak si myslí o vytvoření technologie, která by lidi skutečně připravila o práci, se Drai neznepokojoval.

„Přemýšlím o tom tak, že nakonec… Myslím, že je to jako říct mi, že učitelé matematiky budou [be put] bez práce, protože existuje něco, čemu se říká kalkulačka…,“ vysvětluje. „Lidé se přizpůsobí. A pak vás bude někdo učit o kalkulačce, že? Takže si myslím, že jde jen o to se tomu přizpůsobit,“ říká Drai.

V současné době zvažované ceny zahrnují úrovně, kde by firma platila 0,40 USD za minutu zpracovaného videa, zatímco menší tvůrci se místo toho mohou rozhodnout pro měsíční předplatné, které je omezeno na 10 hodin obsahu měsíčně. (Tato čísla se mohou změnit.) Během testování bylo používání produktu zdarma.

První uživatelé používali Dumme pro různé úpravy, včetně generování klipů z jejich video podcastů pro publikování v Shorts, stejně jako ořezávání dalších nových videí a procházení jejich zadních katalogů.

Zdá se, že produkt je konkurenceschopný s ostatními technologiemi umělé inteligence na trhu, včetně technologie od tvůrce Jellysmack, která využívá umělou inteligenci k přeměně delších videí na YouTube na kratší videa tím, že je sestříhá, změní velikost a optimalizuje pro konkrétní platformy – výsledek její akvizice Kamua v roce 2021. Mezi další nástroje provádějící podobnou práci patří věci jako Vidyo.ai, Detail, TubeBuddy, Wisecut a další. Do jaké míry Dumme uspěje nebo selže, bude záviset na tom, jak překoná konkurenty v kvalitě práce a nákladech – metriky, které budou teprve určeny.

Někteří investoři však sází na Dumma. Před spuštěním startup získal počáteční kolo 3,4 milionu dolarů od Y Combinator, Caffeinated Capital, Max a Nellie Levchin (prostřednictvím SciFi VC), Suhail Doshi, Nico Chinot, Protocol Labs, Chris Puscasiu a další andělé.

Vzhledem k zájmu a velké čekací listině Dumme říká, že se snaží každý týden přijmout kolem 500 lidí. Čtenáři TechCrunch mohou přeskočit řádek pomocí zvacího kódu TECHCRUNCH, dokud nedojdou sloty.

Read More

By admin

Leave a Reply

Your email address will not be published. Required fields are marked *