Seite 3 von 3 ErsteErste 123
Zeige Ergebnis 31 bis 40 von 40

Thema: KI lernt boxen

  1. #31
    Registrierungsdatum
    11.08.2018
    Beiträge
    635

    Standard

    Komplexität von Schach vs. Boxen:

    Ich weiß nicht wie ungerecht der Vergleich (aufgrund der unterschiedlichen Algorithmen) ist, doch hat das Programm AlphaZero nur wenige zig Millionen Spiele gebraucht, um die stärkste Schachengine der Welt zu werden. Nach der gleichen Anzahl an Versuchen, haben die Bots in dem Video oben noch nicht sooo viel auf die Ketten bekommen.

  2. #32
    Registrierungsdatum
    29.10.2009
    Alter
    41
    Beiträge
    1.133

    Standard

    Nur so als Denkanstoß - eine Schach-KI kann die Stimmung des Gegenspielers, seine Müdigkeit, etc. nicht erkennen. Sie kann nicht bluffen oder einen Bluff erkennen, sie betreibt beim Spielen keine psychologische Kriegsführung und ist für diese auch nicht anfällig. D.h., dass ihr schon einige Infos fehlen, die menschliche Spieler in menschlichen Partien durchaus nutzen.
    Das heißt wiederum, dass das Schach selbst zwar hochabstrakt ist, das Schachspielen aber eine gehörige biologische Komponente beinhaltet. Und trotzdem ist die KI besser als der Mensch und wird von diesen fürs Training genutzt, obwohl sie keinerlei biologische Komponenten des Schachspielens kennt oder vermitteln kann.
    So ist es auch denkbar, dass auch eine unbiologische Simulation des Boxens (kein Chi, keine Wirbelsäule, keine Faszien, etc.) dennoch ausreichend sein könnten, um nutzbare Erkenntnisse zu produzieren, wie z.B. "besetze, wenn möglich, die Mitte des Ringes" - genau das hat die KI nämlich irgendwann getan.

  3. #33
    Registrierungsdatum
    18.06.2002
    Ort
    Chemnitz
    Alter
    49
    Beiträge
    803

    Standard

    Hallo,

    Zitat Zitat von Pflöte Beitrag anzeigen
    Also frisch noch einmal: Es geht mir darum, ob ich als Mensch von der KI lernen kann.
    Nur noch einmal zu diesem letzten Punkt.

    Der große Nachteil einer selbstlernenden KI, ich hatte das schon erwähnt, ist, dass man zwar die optimale Lösung erhält, aber nicht eine Erklärung dafür, warum gerade dies die optimale Lösung ist. Hier mal ein Beispiel einer Turn-Lösung einer NL Hold'em Simulation (beliebig aus den Netz geklaut):

    StartScreen_Dojo.png

    Hier sind mal Frequenzen, was mit welcher Hand mit welcher Häufigkeit gemacht werden muss, um ein optimales Ergebnis zu erzielen, wenn das Board Jh9c6h7d ist. Beispiel A2s

    25% der Zeit 150% pot bet
    8% der Zeit 65% pot bet
    1% der Zeit 1% pot bet
    66% der Zeit checken

    Das bringt mehrere Schwierigkeiten mit sich.

    1.) Warum ist das so?
    2.) Wie soll ich das umsetzen?

    Warum ist das so, wird ein ewiges Rätsel des Solvers bleiben. Man kann nur diese und ähnliche Situationen studieren und Gemeinsamkeiten und Unterschiede in den Frequenzen untersuchen und sich damit erschließen (ahem, raten), warum der Solver macht was er macht.
    Wie soll ich das umsetzen? Gar nicht. Ich kann es gar nicht, weil ich ein Mensch bin. Ich kann mich aber im Spiel der optimalen Lösung nähern. Ich kann zum Beispiel aus der Solverarbeit mitnehmen, dass in bestimmten Situationen mit bestimmten Handtypen bestimmte Aktionen richtig sind. Wenn ich weiß, dass ich in 25 Prozent der Fälle checken soll, kann ich das tun, indem ich immer dann checke, wenn meine höhere Karte ein Karo ist.
    Auf diese Art und Weise kann ich die die ideale Lösung des Solvers als Mensch approximieren.

    Zitat Zitat von Pflöte Beitrag anzeigen
    Ein Tiger wird mich auch im Zweikampf besiegen, doch halte ich hier den Lehrwert (außer sich besser nicht mit Tigern anzulegen) für nicht vorhanden.
    Ist nicht genau dies der Ansatz der chinesischen tierbasierten Kampfstile?
    Gab es hier nicht die Erkenntnis, dass das Tier dem Menschen in allem überlegen sei, außer im rationalen Planen? Wurden daher nicht die grundliegenden Bewegungs- und Taktikprinzipien der Tiere nachgeahmt? Wohl gemerkt: Nicht die exakten Bewegungen und Taktiken, nur die Prinzipien.

    Zitat Zitat von Pflöte Beitrag anzeigen
    Also frisch noch einmal: Es geht mir darum, ob ich als Mensch von der KI lernen kann.
    Sei beruhigt. Das kannst Du, aber es ist Arbeit. Viel Arbeit.

    Grüße
    Sven

  4. #34
    Registrierungsdatum
    11.08.2018
    Beiträge
    635

    Standard

    Es geht mir darum, ob ich als Mensch von einer einen Boxing-Bot steuernden KI lernen kann besser zu boxen.

  5. #35
    Registrierungsdatum
    11.08.2018
    Beiträge
    635

    Standard

    Zitat Zitat von Lugasch Beitrag anzeigen
    So ist es auch denkbar, dass auch eine unbiologische Simulation des Boxens (kein Chi, keine Wirbelsäule, keine Faszien, etc.) dennoch ausreichend sein könnten, um nutzbare Erkenntnisse zu produzieren, wie z.B. "besetze, wenn möglich, die Mitte des Ringes" - genau das hat die KI nämlich irgendwann getan.
    Das denke ich auch. Und vllt. kommt da ja noch die eine oder andere Überraschung ans Licht (ich glaube es erstmal nicht, könnte aber sein), ohne dass die Modelle viel genauer werden.

    Hier mal ein Beispiel dafür, was passiert, wenn ein Modell schlecht äääääh ... modelliert ist:

    Die KI findet eine optimale Lösung, die sich aber nicht in die echte Welt übertragen lässt. So wird das immer sein, mit jedem Modell, auch wenn es nicht immer so deutlich ausfallen muss (bzw. wie von CeKaVau angemerkt, evtl. überhaupt keine Rolle spielt).

  6. #36
    Registrierungsdatum
    29.08.2020
    Beiträge
    97

    Standard

    Zitat Zitat von CeKaVau Beitrag anzeigen
    Hallo,



    Zwei Fragen:

    1.) Ist das gut? Ich habe keine Ahnung von Starcraft.
    2.) Ist das wirklich eine KI im Sinne der oben genannten selbstoptimierenden Systeme. Kann es sein, dass das "nur" eine Heuristik ist, die die Programmierer hinterlegt haben, weil sie das für einen guten Zug hielten.

    Aus der Zeit, als ich noch Battle Isle gespielt habe, kenne ich noch den Fall, dass der Computergegner (ich sage mal nicht KI), wenn er schon absolut platt war und nur noch zwei Panzer oder so hatte, alle Kapazitäten darauf geworfen hat, Tankfahrzeuge herzustellen, anstatt mehr Panzer.
    Hier war sicher kein selbstlernendes System am Werk

    Grüße
    Sven
    Wusste ich auch nicht: Wiki:
    Google DeepMind, ein Tochterunternehmen von Alphabet Inc., kündigte am 4. November 2016 an, dass StarCraft II zu einer Testplattform für Künstliche Intelligenz weiterentwickelt wird.
    Im Januar 2019 wurde bekannt, dass das AlphaStar, die KI von DeepMind, Erfolg hatte. Es schlug menschliche Profispieler.

  7. #37
    Registrierungsdatum
    29.08.2020
    Beiträge
    97

    Standard

    Zitat Zitat von Lugasch Beitrag anzeigen
    Nur so als Denkanstoß - eine Schach-KI kann die Stimmung des Gegenspielers, seine Müdigkeit, etc. nicht erkennen. Sie kann nicht bluffen oder einen Bluff erkennen, sie betreibt beim Spielen keine psychologische Kriegsführung und ist für diese auch nicht anfällig. D.h., dass ihr schon einige Infos fehlen, die menschliche Spieler in menschlichen Partien durchaus nutzen.....
    Bin zwar bezüglich des Resümee deiner Post einer Meinung mit dir, allerdings, kann man Poker gewinnen ohne Bluff?
    KI gewinnt gegen Pokerprofis

  8. #38
    Registrierungsdatum
    29.08.2020
    Beiträge
    97

    Standard

    Zitat Zitat von CeKaVau Beitrag anzeigen
    Hallo,



    Nur noch einmal zu diesem letzten Punkt.

    Der große Nachteil einer selbstlernenden KI, ich hatte das schon erwähnt, ist, dass man zwar die optimale Lösung erhält, aber nicht eine Erklärung dafür, warum gerade dies die optimale Lösung ist. Hier mal ein Beispiel einer Turn-Lösung einer NL Hold'em Simulation (beliebig aus den Netz geklaut):

    ...

    Grüße
    Sven
    Das ist aus technischer Sicht ein Problem, wenn ich das Programm und seine Ergenisse auswerte und wissen will, warum sich das Programm so entschiedne hat. Ist wie du sagst, nicht richtig nachvollziehbar. Daher auch die Probleme z. B. bei autonomen Fahren, wenn du von einem autonom fahrenden Laster überfahren wirst, wer wird verklagt oder ist verantwortlich? Das sind Verkehrsrechtliche, Versicherungstechnische und auch Ethische Probleme.

    Aber verwenden kann man die Lösungen wenn man vom Programm weggeht und das Problem ansieht, was gelöst wurde, schon.
    Z. B. Schach: Leela wird dich schlagen. Ein Analyseprogram wird danach bei der Partie herausfinden, wo der Knackpunkt lag, wo der entscheidende Fehlzug. Daraus kann man lernen, auch wenn keiner weis, was Leela mit diesem Zug bewirken wollte und auch kein Softwareexperte die Entscheidung bei Leela reproduzieren kann.

    Zum biologischen nachprogrammieren: Das hat mir mein Youtube vorgeschlagen: ein Spiel auf Steam kaufbar:





    Hier wurden doch schon verschiedene Bewegungsmuster und "Kampfverhalten" einprogrammiert?

  9. #39
    Registrierungsdatum
    18.06.2002
    Ort
    Chemnitz
    Alter
    49
    Beiträge
    803

    Standard

    Hallo,

    Zitat Zitat von Barbecue Beitrag anzeigen
    ... kann man Poker gewinnen ohne Bluff?
    das ist Waaaaay Off Topic, aber trotzdem eine schnelle Antwort:

    Kann man beim Schach gewinnen, obwohl seine Leichtfiguren nicht verwendet? Kann man, wenn der andere schlecht genug ist.
    Kann man beim Poker gewinnen, wenn man nicht blufft: Kann man, wenn der andere schlecht genug ist.

    Es gibt einen bestimmten Gegnertyp, der CS (calling station) genannt wird. Gegen diesen gewinnt man, indem man nicht blufft sondern nur value bettet. Auch mit Händen, die man gegen andere Gegner nicht value betten würde.

    Hier liegt im übrigen ein Schwachpunkt der oben genannten KI-Lösung. Ich weiß aber nicht, ob das Solver für andere Spiele auch betrifft.

    Ein NL-Solver spuckt das Nash Equilibrium für eine bestimmte Situation aus. Dies ist die optimale Lösung, aber ACHTUNG, so dumm und abwegig dies auch klingt: Es ist nicht die beste Lösung.
    KI-Solver lernen, indem sie gegen sich selbst spielen. Was wir als Lösung bekommen, ist das Nash Equilibrium. Diese Lösung ist durch andere Spieler nicht ausnutzbar; die enthält keine Schwachstelle. Das heißt aber nicht, dass es die Lösung mit dem höchsten Erwartungswert ist. Es ist nur die Lösung mit dem höchsten Erwartungswert gegen einen anderen GTO Spieler.

    Menschliche Gegner haben Tendenzen, die von der optimalen GTO-Strategie abweichen: Sie callen zu oft oder zu selten, sie folden zu oft oder zu selten, sie checken zu oft oder zu selten, ...
    Gute Pokerspieler (auch schon in relativ niedrigen Limits online) treffen in jedem Spielzug drei Entscheidungen:

    1.) Wie sieht die optimale GTO-Lösung hier aus?
    2.) Wie muss ich davon abweichen, um meinen Erwartungswert zu maximieren.
    3.) Randomisieren

    Beispiel: Mal angenommen, ich habe am River eine mittelprächtige Hand und GTO würde mir sagen, dass ich 50% der Zeit checken soll und 50% der Zeit halben pot setzen. Jetzt weiß ich aber auf Grund meiner Beobachtungen, dass mein Gegenüber ein übler Nit ist. Jemand der nur die allerstärksten Hände spielt. In diesem Fall weiß ich dann, dass ich nur selten einen call von einer schlechteren Hand bekommen würde. Ich passe demzufolge die GTO-Lösung an, indem ich den checking-Anteil erhöhe, auf sagen wir 75%.
    Danach werfe ich den RNG an und wenn ich einen Wert zwischen 0 und .25 erhalte bette ich, liegt er darüber checke ich.

    Um meine Erwartungswert zu maximieren, muss ich die "optimale" Lösung an den Gegner anpassen.

    Grüße
    Sven

  10. #40
    Registrierungsdatum
    29.08.2020
    Beiträge
    97

    Standard

    So, mein Experiment auf meinem Super-Server ist abgeschlossen, ich habe die obigen Boxer x-Millionenfach auf meinem Server gegeneinander antreten lassen.
    Tut mir schrecklich leid für alle KKBler, die jetzt die falsche KK üben:
    Herausgekommen ist das:


Seite 3 von 3 ErsteErste 123

Aktive Benutzer

Aktive Benutzer

Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)

Ähnliche Themen

  1. Mädels - lernt SV !
    Von CassiusClay im Forum Hybrid und SV-Kampfkünste
    Antworten: 21
    Letzter Beitrag: 18-07-2015, 15:44
  2. Was arbeitet/lernt ihr so?
    Von Caine123 im Forum Off-Topic Bereich
    Antworten: 1
    Letzter Beitrag: 07-08-2008, 15:18
  3. Bo, Jo... wo lernt man das???
    Von Sacul92 im Forum Waffen in Kampfkünsten
    Antworten: 3
    Letzter Beitrag: 04-04-2008, 17:41
  4. wie lernt ihr das
    Von Rainbow Warrior im Forum Kickboxen, Savate, K-1.
    Antworten: 5
    Letzter Beitrag: 09-02-2007, 09:33
  5. Lernt ihr auch Tierstile?
    Von Duncan Leung im Forum Kung Fu, Wushu, Kuoshu Sanda, Lei Tai
    Antworten: 19
    Letzter Beitrag: 06-06-2006, 21:49

Forumregeln

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •