Ez a kutatás egy olyan keretrendszert mutat be, amely automatizálja a szakértői tudás AI ügynökök számára felhasználható formába öntését. A COLLEAGUE.SKILL projekt segítségével egy emberi szakértő digitális kommunikációjából és dokumentumaiból egy strukturált, hívható AI képesség jön létre, amely megőrzi és reprodukálja az adott személy szakmai és interperszonális viselkedését.
A cikk bemutatja, hogyan használható a generatív mesterséges intelligencia gyakorlati, otthoni projektekben, például személyre szabott kerttervek készítésére, a növények optimális elhelyezésére, vagy akár komplex okosotthon-automatizálási logikák (IFTTT) létrehozására a meglévő eszközökhöz.
A cikk arra a problémára hívja fel a figyelmet, hogy a felhasználók és fejlesztők hajlamosak túl komplex, hosszan futó feladatokat bízni az AI ügynökökre (pl. Claude). Ezek az ügynökök azonban memóriakorlátok és a hibák felhalmozódása miatt gyakran megbízhatatlanná válnak, ezért a gyakorlatban hatékonyabb lehet a feladatokat kisebb, jól definiált lépésekre bontani.
Ezek a kutatások olyan megerősítő tanuláson (RL) alapuló módszereket mutatnak be, amelyek célja az LLM-alapú keresőügynökök képességeinek javítása. Ahelyett, hogy egyetlen, statikus lekérdezéssel próbálnának információt szerezni, a modellek megtanulnak egy iteratív, lépésről-lépésre haladó keresési és érvelési folyamatot, ami hatékonyabbá teszi őket a hosszú dokumentumokban való komplex információkinyerésben.
A kutatás rávilágít, hogy a jelenlegi módszerek nem mérik hatékonyan az LLM-ek hosszú távú memóriáját, mivel a tesztek túl statikusak. Ezért új, dinamikus benchmarkokat fejlesztenek, amelyek valósághű, elágazó párbeszédeken keresztül tesztelik a modellek képességét az információk hosszú távú megőrzésére, frissítésére és alkalmazására.
Ez a kutatási terület azzal foglalkozik, hogyan lehet hatékony hosszú távú memóriát kialakítani olyan AI ügynökök számára, amelyek többféle (multimodális) adatot dolgoznak fel. Ahelyett, hogy minden apró részletet eltárolnának, a rendszerek a feladat szempontjából kulcsfontosságú információkat emelik ki és strukturált formában (pl. gráfmemória) mentik el, hogy koherens és releváns tudásbázist építsenek.
A tanulmány az AI ügynökök sebezhetőségeit vizsgálja, amelyek túlmutatnak az egyszerű prompt injekción. Mivel az ügynökök hosszú távú memóriával rendelkeznek és autonóm módon hajtanak végre feladatokat, egy sikeres támadás (pl. "memóriamérgezés") lehetővé teheti a támadó számára, hogy tartósan átvegye az irányítást az ügynök felett, ami komoly biztonsági kockázatot jelent.
Nem találtam publikusan elérhető háttérinformációt.
A ZEDA egy olyan technika, amely a már betanított, statikus Mixture-of-Experts (MoE) modelleket alakítja át hatékonyabb, dinamikus modellekké. Ezáltal a modell megtanulja, hogy az egyszerűbb, kevesebb számítást igénylő feladatoknál (tokeneknél) kihagyja az expertek egy részének aktiválását, így jelentős számítási kapacitást takarít meg a következtetés során.
Nem találtam publikusan elérhető háttérinformációt.
Nem találtam publikusan elérhető háttérinformációt.
Nem találtam publikusan elérhető háttérinformációt.
Az Odysseus egy nyílt forráskódú, saját hardveren futtatható (self-hosted) platform, amely a ChatGPT-hez vagy a Claude-hoz hasonló, de lokális kontrollt biztosító munkakörnyezetet kínál AI modellekkel való interakcióra.
Fejlesztők és tartalomkészítők az Anthropic Claude Code modelljét használják a videószerkesztési munkafolyamatok automatizálására. Természetes nyelvű utasításokkal vezérlik a teljes vágási, animációs és renderelési folyamatot, kiváltva a manuális szerkesztőszoftverek, például a Premiere Pro használatát.
Egy Reddit felhasználó írta le, hogyan talált az OpenAI Codex egy nem várt megoldást egy rendszeradminisztrációs problémára, amikor nem rendelkezett sudo jelszóval egy Windows Subsystem for Linux (WSL) környezetben.