DeepMind říká, že vyvinul model umělé inteligence, nazvaný RoboCat, který dokáže provádět řadu úkolů napříč různými modely robotických paží. To samo o sobě není nijak zvlášť nové. DeepMind ale tvrdí, že model je první, který je schopen řešit a přizpůsobovat se více úkolům, a to pomocí různých robotů v reálném světě.
„Ukazujeme, že jeden velký model dokáže vyřešit různorodou sadu úkolů na více skutečných robotických provedeních a dokáže se rychle přizpůsobit novým úkolům a provedením,“ Alex Lee, vědecký pracovník DeepMind a spolupřispěvatel v týmu za RoboCat, řekl TechCrunch v e-mailovém rozhovoru.
RoboCat – který byl inspirován Gato, modelem umělé inteligence DeepMind, který dokáže analyzovat a reagovat na text, obrázky a události – byl trénován na datech o obrázcích a akcích shromážděných z robotiky v simulaci i v reálném životě. Data, říká Lee, pocházejí z kombinace jiných modelů pro ovládání robotů ve virtuálních prostředích, lidí ovládajících roboty a předchozích iterací samotného RoboCat.
Pro výcvik RoboCat výzkumníci z DeepMind nejprve shromáždili 100 až 1000 ukázek úkolu nebo robota pomocí robotické paže ovládané člověkem. (Předpokládejme, že robotické rameno zvedne ozubená kola nebo naskládá bloky.) Poté doladili RoboCat na úkol a vytvořili specializovaný „spin-off“ model, který na úkolu cvičil v průměru 10 000krát.
Využitím jak dat generovaných spin-off modely, tak demonstračních dat, výzkumníci neustále rozšiřovali tréninkový soubor RoboCat – a trénovali následné nové verze RoboCat.
Poděkování za obrázky: DeepMind
Finální verze modelu RoboCat byla trénována na celkem 253 úlohách a testována na sadě 141 variant těchto úloh, a to jak v simulaci, tak v reálném světě. DeepMind tvrdí, že po pozorování 1000 lidmi řízených demonstrací shromážděných během několika hodin se RoboCat naučil ovládat různá robotická ramena.
Zatímco RoboCat byl trénován na čtyřech druzích robotů se dvěma hroty, model se dokázal přizpůsobit složitějšímu rameni s tříprstým chapadlem a dvojnásobným počtem ovladatelných vstupů.
Aby nebyl RoboCat ohlašován jako konec všech modelů umělé inteligence pro ovládání robotů, jeho úspěšnost napříč úkoly se v testování DeepMind drasticky lišila – od 13 % na nižší úrovni až po 99 % na vyšší úrovni. To znamená s 1 000 ukázkami v tréninkových datech; úspěchy byly předvídatelně méně časté s polovičním počtem demonstrací.
Přesto v některých scénářích DeepMind tvrdí, že RoboCat se dokázal naučit nové úkoly s pouhými 100 ukázkami.
Když to vezmeme dále, Lee věří, že RoboCat by mohl předznamenat snížení bariéry pro řešení nových úkolů v robotice.
„S omezeným počtem ukázek pro nový úkol lze RoboCat doladit na nové úkoly a následně sám generovat další data pro další zlepšení,“ dodal.
Do budoucna se výzkumný tým snaží snížit počet ukázek potřebných k tomu, aby se RoboCat naučil dokončit nový úkol, na méně než 10.