Beim Autoresearch-Hackathon, der von Paradigm veranstaltet wird, gewinnt ein Teilnehmer, der so gut wie keine Strategie „selbst entworfen“ hat, am Ende den ersten Platz. Der Sieger Ryan Li, zugleich CEO von SurfAI, sagt, der gesamte Problemlöseprozess sei nahezu vollständig von der KI erledigt worden; er wisse sogar nicht, „wie man gewinnt“, und habe dennoch im Prediction-Market-Challenge schließlich den ersten Platz belegt.
Der Wettbewerb verlangt von den Teilnehmenden, eine Market-Making-Strategie in einem simulierten, binären Prognosemarkt zu entwerfen: Sie stellen Liquidität im Orderbuch über Limit-Orders bereit und balancieren die Profitabilität zwischen „Arbitrageuren“ und „Retail-Flow“. Die finale Platzierung wird anhand des durchschnittlichen edge (Gewichtungsvorteil) über 200 zufällige Simulationen berechnet. Ryans Endergebnis beträgt 42.32 US-Dollar mean edge (berechnet als Median über drei Sätze zufälliger Seeds); nach einer erneuten Bewertung steigt er auf den ersten Platz.
Claude Code + Codex automatisierte Forschung, erzeugt 1,039 Strategien
Anders als bei traditionellen quantitativen Trading- oder Market-Making-Strategien, die von menschlichen Experten abhängen, um Parameter anzupassen und Modellierung vorzunehmen, folgt Ryan dem Ansatz der „Bitter Lesson“, den Rich Sutton in den letzten Jahren vorgeschlagen hat: Rechenleistung und Suchumfang sollen die menschliche Erfahrung übertreffen. Er verwandelt die gesamte Aufgabe in einen „automatisierten Forschungs“-Prozess (autoresearch), indem er mit mehreren KI-Agents parallel den Lösungsraum erkundet, statt manuell zu optimieren.
Während des gesamten Prozesses setzt er 8 bis 20 parallel laufende KI-Agents ein (hauptsächlich basierend auf Claude Code, ergänzt durch Codex). Jeder Agent ist jeweils für unterschiedliche Annahmen und Parameterbereiche zuständig und generiert fortlaufend Strategien, führt Simulationen aus und meldet Ergebnisse zurück. Am Ende kumuliert sich ein Output von 1,039 Varianten von Strategien; es werden über 2,000 Bewertungen durchgeführt und automatisch 47 Parameter-Scan-Skripte generiert. Der gesamte Suchumfang entspricht sinngemäß dem Komprimieren von mehreren Wochen manueller Experimente auf nur wenige Stunden.
Von der KI erzeugte 900 Zeilen Python Market-Making-Algorithmus holt den Hackathon-Sieg
Auf der Strategieseite ist die letztlich siegreiche Lösung ein Market-Making-Algorithmus aus etwa 900 Zeilen Python. Die Kernlogik stammt nicht aus einem einzelnen Entwurf, sondern aus der Kombination mehrerer „bewährt wirksamer“ Module. Dazu gehören das Meiden von extrem engen Spreads in Bereichen, in denen Arbitrageure sicher gewinnen, die Schätzung des wahren Preises mittels Informationstheorie, die dynamische Anpassung der Quotierungsgröße anhand des Arbitrage-Risikos sowie das proaktive Eintreten in hochprofitable Spannen, wenn das Orderbuch des Gegners leergefressen wird.
Die entscheidendste Durchbruchstelle stammt von einem KI-Agent, der bei der Optimierung „komplett bestehende Strategien verworfen und bei null angefangen“ hat. Als die Gesamtoptimierung bei etwa +25 edge stecken blieb, entdeckte dieser Agent eigenständig ein Sizing-Modell, das „die Wahrscheinlichkeit von Arbitrage-Risiko“ in den Mittelpunkt stellt. Dadurch wurde die Strategieleistung einmalig von +25 auf +44 gehoben und wurde zum Wendepunkt des gesamten Wettbewerbs. Dieses Ergebnis bestätigt auch direkt Ryans Methodik: Wenn die Suche in lokale Optima gerät, ist ein Neustart effektiver als Feintuning.
Der absolute Vorteil der KI-Forschung: Automatisiertes Ausprobieren
Ryan führt in seinem Fazit aus, dass der Kern dieses Wettbewerbs nicht darin besteht, eine „kluge“ Strategie zu entwerfen, sondern ein System aufzubauen, das in großem Maßstab suchen, Ideen verifizieren und verworfene Ansätze aussortieren kann. Anstatt sich auf menschlichen Instinkt zu verlassen, soll die KI im riesigen Raum an Möglichkeiten ausprobieren – und durch Parallelisierung sowie Automatisierung die Effizienz erhöhen.
Dieser Fall stärkt außerdem die Rolle von „Agentic AI“ in Engineering- und Forschungsprozessen: KI ist nicht mehr nur ein Hilfswerkzeug, sondern kann direkt die Kern-Execution-Einheit übernehmen, die Exploration und Entscheidungen ausführt. In manchen hochstrukturierten, gut simulierbaren Problemen können Menschen sogar vollständig aus der Rolle des „Problemlösers“ herausgehen und stattdessen den Suchrahmen sowie die Bewertungsmechanismen selbst entwerfen.
Der Artikel „Claude Code automatisierte Forschung gewinnt den Hackathon! Gewinner: Ich wusste es wirklich nicht, wie man gewinnt“ erschien zuerst bei 链新闻 ABMedia.
Verwandte Artikel
Innovation fördern! US-Richter verbieten regulative Vorhersagemärkte in Arizona und setzen die Klage gegen Kalshi aus
Fordert Innovation auf! US-Richter untersagen Arizona den regulatorischen Umgang mit Prognosemärkten und setzen die Klage gegen Kalshi aus
Fordern Sie Innovation! US-Richter verbieten dem US-Bundesstaat Arizona die Regulierung von Prognosemärkten und setzen die Klage gegen Kalshi aus
Polymarket-Trader verwandelt $500 in $252K , nachdem die UFC erneut einen Wertungsfehler macht
Polymarket prüft Start-ups im Ökosystem und geht gegen Insiderhandel und Marktmanipulation vor
Innovation fördern! US-Richter verbieten dem Bundesstaat Arizona die Regulierung von Prognosemärkten und setzen die Klage gegen Kalshi aus