Udržet krok s tak rychle se rozvíjejícím odvětvím, jako je umělá inteligence, je náročný úkol. Takže dokud to za vás neudělá umělá inteligence, zde je praktický souhrn příběhů z minulého týdne ze světa strojového učení spolu s pozoruhodnými výzkumy a experimenty, které jsme sami o sobě nepokryli.
Dalo by se říci, že minulý týden Apple velmi viditelně a záměrně hodil klobouk do ultrasoutěžního závodu AI. Není to tak, že by společnost dříve nesignalizovala své investice do – a upřednostňování – AI. Ale na své WWDC akci dal Apple jasně najevo, že za mnoha funkcemi v jeho nadcházejícím hardwaru i softwaru stojí umělá inteligence.
Například iOS 17, který má dorazit koncem tohoto roku, může navrhovat recepty na podobná jídla z fotografie iPhonu pomocí počítačového vidění. Umělá inteligence také pohání Journal, nový interaktivní deník, který vytváří personalizované návrhy na základě aktivit v jiných aplikacích.
iOS 17 bude také obsahovat vylepšené automatické opravy založené na modelu umělé inteligence, který dokáže přesněji předvídat další slova a fráze, které by uživatel mohl použít. Postupem času se přizpůsobí a naučí se uživatelsky nejčastěji používaná slova – včetně nadávek, zábavně.
Umělá inteligence je také zásadní pro náhlavní soupravu pro rozšířenou realitu Vision Pro od společnosti Apple – konkrétně FaceTime na Vision Pro. Pomocí strojového učení dokáže Vision Pro vytvořit virtuálního avatara nositele, který interpoluje celou škálu zkřivení obličeje – až po napětí kůže a svalovou práci.
Poděkování za obrázky: Jablko
Možná to nebude generativní umělá inteligence, která je dnes bezpochyby nejžhavější podkategorií umělé inteligence. Ale zdá se mi, že záměrem Applu bylo nastolit jakýsi comeback — ukázat, že není podceňován po letech zmítaných projektů strojového učení, od neohrožené Siri až po samořídící auto v produkčním pekle.
Promítání síly není jen marketingový trik. Historický podprůměrný výkon Applu v oblasti umělé inteligence údajně vedl k vážnému odlivu mozků, přičemž The Information uvádí, že talentovaní vědci strojového učení – včetně týmu, který pracoval na typu technologie, která je základem ChatGPT OpenAI – opustili Apple na zelenější pastviny.
Ukazuje, že to s AI myslí vážně Lodní doprava produkty s umělou inteligencí se cítí jako nezbytný krok – a měřítko, které někteří konkurenti Applu ve skutečnosti v nedávné minulosti nedokázali splnit. (Tady se na tebe dívám, Meta.) Podle všeho se Apple minulý týden prosadil – i když to nebylo nijak zvlášť hlasité.
Zde jsou další důležité titulky AI z posledních několika dní:
- Meta vytváří hudební generátor: Aby společnost Meta nebyla překonána, vydala svůj vlastní hudební generátor poháněný umělou inteligencí – a na rozdíl od Googlu jej vytvořila jako open source. Nástroj pro generování hudby od společnosti Meta s názvem MusicGen dokáže proměnit textový popis na přibližně 12 sekund zvuku.
Regulátoři zkoumají bezpečnost AI: Po oznámení vlády Spojeného království minulý týden, že letos na podzim plánuje uspořádat „globální“ summit o bezpečnosti umělé inteligence, se OpenAI, Google DeepMind a Anthropic zavázaly poskytnout „včasný nebo prioritní přístup“ ke svým modelům umělé inteligence na podporu výzkumu hodnocení a bezpečnosti.
AI, seznamte se s cloudem: Salesforce uvádí na trh novou sadu produktů zaměřenou na posílení své pozice v ultrakonkurenčním prostoru umělé inteligence. Sada nazvaná AI Cloud, která obsahuje nástroje navržené k poskytování AI „připravené na podnikání“, je nejnovějším mezioborovým pokusem společnosti Salesforce rozšířit své produktové portfolio o možnosti umělé inteligence.
Testování AI textu na video: TechCrunch navázal na Gen-2, umělou inteligenci Runway, která generuje krátké videoklipy z textu. Verdikt? Než se technologie přiblíží k generování záběrů ve filmové kvalitě, zbývá ještě dlouhá cesta.
Více peněz pro podnikovou umělou inteligenci: Na znamení toho, že na generativní startupy s umělou inteligencí je spousta peněz, společnost Cohere, která vyvíjí ekosystém modelu AI pro podnik, minulý týden oznámila, že v rámci svého kola série C získala 270 milionů dolarů.
Žádný GPT-5 pro vás: OpenAI stále neškolí GPT-5, řekl generální ředitel OpenAI Sam Altman na nedávné konferenci pořádané Economic Times – měsíce poté, co se startup podporovaný Microsoftem zavázal, že nebude pracovat na nástupci GPT-4 „nějakou dobu“ poté, co mnoho vedoucích pracovníků v oboru. a akademici vyjádřili obavy z rychlého pokroku Altmanových velkých jazykových modelů.
Asistent psaní AI pro WordPress: Automattic, společnost stojící za WordPress.com a hlavní přispěvatel do open source projektu WordPress, spustila minulé úterý asistenta AI pro populární systém pro správu obsahu.
Instagram získává chatbota: Instagram může pracovat na chatbotu s umělou inteligencí, podle obrázků, které unikl výzkumník aplikací Alessandro Paluzzi. Podle úniků, které odrážejí probíhající vývoj aplikací, které se mohou nebo nemusí dodávat, mohou tito agenti AI odpovídat na otázky nebo poskytovat rady.
Další strojové učení
Pokud vás zajímá, jak by umělá inteligence mohla ovlivnit vědu a výzkum v příštích několika letech, tým napříč šesti národními laboratořemi sepsal zprávu založenou na workshopech konaných v loňském roce, přesně o tom. Někdo může být v pokušení říci, že vzhledem k tomu, že zpráva vychází z trendů z minulého roku, a nikoli z tohoto, ve kterém věci postupovaly tak rychle, může být již zastaralá. Ale zatímco ChatGPT udělal obrovské vlny v oblasti technologií a povědomí spotřebitelů, pravdou je, že to není pro seriózní výzkum nijak zvlášť důležité. Trendy ve větším měřítku jsou a pohybují se jiným tempem. 200stránková zpráva rozhodně není lehké čtení, ale každá sekce je užitečně rozdělena na stravitelné kousky.
Jinde v ekosystému národních laboratoří vědci z Los Alamos usilovně pracují na pokroku v oblasti memristorů, které kombinují ukládání a zpracování dat – podobně jako to dělají naše vlastní neurony. Je to zásadně odlišný přístup k počítání, i když takový, který ještě nepřinesl ovoce mimo laboratoř. Zdá se, že tento nový přístup alespoň posouvá míč dopředu.
Zařízení AI s jazykovou analýzou je zobrazeno v této zprávě o policejních interakcích s lidmi, které zastavili. Zpracování přirozeného jazyka bylo použito jako jeden z několika faktorů k identifikaci jazykových vzorců, které předpovídají eskalaci zastávek – zejména u černochů. Metody lidského a strojového učení se navzájem posilují. (Přečtěte si noviny zde.)
Poděkování za obrázky: Cyrille Verdon / Renaud Defrancesco BUREAU 141 / EPFL
DeepBreath je model vyškolený na nahrávkách dýchání pořízených od pacientů ve Švýcarsku a Brazílii, o kterých jeho tvůrci v EPFL tvrdí, že mohou pomoci včas identifikovat respirační stavy. Plán je umístit to tam v zařízení zvaném Pneumoscope pod spinout společnosti Onescope. Pravděpodobně je budeme sledovat, abychom získali další informace o tom, jak se společnosti daří.
Další pokrok v oblasti AI v oblasti zdraví přichází z Purdue, kde výzkumníci vytvořili software, který aproximuje hyperspektrální snímky pomocí fotoaparátu smartphonu, úspěšně sleduje krevní hemoglobin a další metriky. Je to zajímavá technika: pomocí super-slow-mo režimu telefonu získává spoustu informací o každém pixelu v obrázku, což dává modelu dostatek dat k extrapolaci. Mohl by to být skvělý způsob, jak získat tento druh zdravotních informací bez speciálního hardwaru.
Poděkování za obrázky: MIT
Zatím bych nevěřil autopilotovi, aby provedl úhybné manévry, ale MIT posouvá technologii blíže s výzkumem, který pomáhá umělé inteligenci vyhýbat se překážkám a zároveň udržovat požadovanou dráhu letu. Jakýkoli starý algoritmus může navrhnout divoké změny směru, aby nedošlo k havárii, ale dělat to při zachování stability a nic uvnitř nerozmělňovat. Týmu se podařilo získat simulovaný proudový letoun, aby provedl některé manévry podobné Top Gunu autonomně a bez ztráty stability. Je to těžší, než to zní.
Poslední tento týden je Disney Research, na který se lze vždy spolehnout, že předvede něco zajímavého, co se také jen náhodou vztahuje na filmovou tvorbu nebo provoz zábavních parků. Na CVPR předvedli výkonnou a všestrannou „síť detekce orientačních bodů na obličeji“, která dokáže nepřetržitě sledovat pohyby obličeje a používat více libovolných referenčních bodů. Snímání pohybu již funguje bez malých snímacích bodů, ale díky tomu by mělo být ještě kvalitnější – a důstojnější pro herce.