14/1/13

John Forbes Nash

Την Παρασκευή 11/1/2013, στο πλαίσιο των δραστηριοτήτων του Κύκλου Κινηματογράφου, έγινε από τη μαθηματικό Ειρήνη Παπαθανασίου μία συνοπτική παρουσίαση της ζωής και του έργου του σπουδαίου μαθηματικού John Forbes Nash. Αφορμή για το γεγονός αυτό στάθηκε η προβολή της βραβευμένης με Όσκαρ ταινίας "A Beautiful Mind" με πρωταγωνιστές τους Russell Crowe και Jennifer Connelly. Ακολουθούν το κείμενο και οι διαφάνειες της παρουσίασης.
ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΝ ΝΟΜΠΕΛΙΣΤΑ NASH




Ο John Nash γεννήθηκε στη Δυτική Βιρτζίνια το 1928. Παρότι αγαπούσε τα μαθηματικά αποφασίζει να γίνει χημικός μηχανικός, κάτι που στην πορεία δεν του άρεσε και επιστρέφει στα μαθηματικά.
Ο σπουδαστής Nash 19 ετών κατάφερε να λύσει ένα σπουδαίο θεώρημα και ο καθηγητής του σε συστατική επιστολή προς το Πανεπιστήμιο του Princeton όπου βρισκόταν ο Einstein έγραψε: «Αυτός ο άνθρωπος είναι μια ιδιοφυία».
Στα 23 παίρνει το Ph.D και διδάσκει στο MIT.
Ο John Forbes Nash το 1951 ολοκληρώνει τη σημαντικότερή του εργασία «Nash Equilibrium» η Ισορροπία Nash όπου απέδειξε ότι κάτω από πολύ γενικές συνθήκες πάντα υπάρχει ένα σημείο ισορροπίας, δηλαδή σ΄ένα παιχνίδι κανέναν παίκτη δεν τον συμφέρει να απομακρυνθεί , δεδομένων των επιλογών των αντιπάλων τους.  Αυτή η εργασία του τον οδήγησε στην απόκτηση του βραβείου Νόμπελ στα οικονομικά το 1994.
(Από την ηλικία των 29 ετών έπασχε από σύνδρομο καταδίωξης και σχιζοφρένειας.)
 To 1959 όμως παθαίνει σχιζοφρένεια μια αρρώστια όπου συμπίπτει με την εγκυμοσύνη της γυναίκας του Alicia. Πιστεύει πως είναι εντεταλμένος πράκτορας της NSA ( Υπηρεσία Εθνικής Ασφαλείας) και αρχίζει και αποκρυπτογραφεί μηνύματα. Ξαφνικά το 1989 , μετά από 30 χρόνια με φάρμακα και τακτικούς εγκλεισμούς σε ψυχιατρικά ιδρύματα , το μυαλό του ανακτά την χαμένη του μεγαλοφυΐα δηλαδή ξαναπαίρνει ΄΄μπροστά΄΄. Ένα περίεργο ξύπνημα!!! Ξεκινά πάλι την Ακαδημαϊκή του καριέρα.
Άνοδος ,ο θάνατος και η ανάσταση
Η σπουδαιότητα της Ισορροπίας Nash στη θεωρία παιγνίων.
Παίγνιο: κατάσταση κατά την οποία δύο ή περισσότεροι παίκτες επιλέγουν τρόπους ενέργειας που δημιουργούν καταστάσεις αλληλεξάρτησης.
Θεωρία παιγνίων: αναλύει αυτές τις καταστάσεις των παικτών όπου ανταγωνίζονται με σκοπό ο καθένας να αποκτήσει το μεγαλύτερο όφελος.

Το θεώρημα που διατύπωσε ο Nash και έγινε γνωστό σε όλο τον κόσμο αναφέρει πως κάθε παίγνιο με πεπερασμένο πλήθος παικτών και ενεργειών έχει τουλάχιστον ένα σημείο ισορροπίας, σύμφωνα με το οποίο όλοι οι παίκτες επιλέγουν τις πιο συμφέρουσες για αυτούς ενέργειες, γνωρίζοντας και τις επιλογές των αντιπάλων τους. Οι παίκτες σκέφτονται τι μπορεί να διαλέξει ο αντίπαλος τους, προσπαθούν να καταλάβουν τη συμπεριφορά των άλλων και επιλέγουν την στρατηγική τους σύμφωνα με αυτό. Δηλαδή η στρατηγική ενός παίκτη αποτελεί την καλύτερη αντίδραση(απόκριση) στην στρατηγική του άλλου παίκτη. Αυτός ο συνδυασμός στρατηγικών αποτελεί ισορροπία Nash.

Ο παίκτης επιλέγει εκείνη από τις δικές του στρατηγικές, η οποία είναι η καλύτερη απάντηση στην στρατηγική που νομίζει ότι θα επιλέξει ο άλλος παίκτης. Επομένως κανένας παίκτης δεν έχει κίνητρο να φύγει μονομερώς από αυτήν την ισορροπία που έχει δημιουργηθεί. Οι παίκτες καταλαβαίνουν πως βρίσκονται σε ισορροπία αν μια αλλαγή στις στρατηγικές από οποιονδήποτε από αυτούς, οδηγήσει σε χαμηλότερο κέρδος από αυτό που θα είχαν αν παρέμεναν στη σωστή στρατηγική.

 Δεδομένου των επιλογών των αντιπάλων, ο παίκτης δεν έχει να κερδίσει κάποιο μεγαλύτερο όφελος και για αυτό δεν αλλάζει στρατηγική.

         Το Δίλημμα του Φυλακισμένου
Δύο ύποπτοι για ληστεία ανακρίνονται από την αστυνομία …
         Αν ομολογήσει μόνο ο ένας τον αφήνουν ελεύθερο ο άλλος τιμωρείται με 5 χρόνια φυλακή.
         Αν δεν ομολογήσει κανείς δεν μπορούν να αποδείξουν ότι έκαναν την ληστεία αλλά θα τους καταδικάσουν για παράνομη οπλοφορία, 2 χρόνια τον καθένα.
Αν ομολογήσουν και οι δύο καταδικάζονται και οι δύο, σε 4 χρόνια φυλακή

(2,2)
(5,0)
(0,5)
(4,4)

Είναι φανερό πως σε κάθε συναλλαγή ή σύγκρουση ατομικών συμφερόντων που θίγει τους ανθρώπους, υπάρχει κάπου εκεί το δίλημμα του φυλακισμένου. Τα παραδείγματα ποικίλλουν από τα πολιτικά παζάρια και τους πλειστηριασμούς έως την συμπεριφορά των οδηγών στους δρόμους και την επιλογή δύο αντιμαχόμενων μερών για το αν θα χρησιμοποιήσουν δικηγόρους ή/ και θα καταφύγουν στα δικαστήρια για να λύσουν τις διαφορές τους.


Ένα Παίγνιο Τηλεπικοινωνιών
Δύο χρήστες θέλουν να στείλουν ο καθένας το δικό τους μήνυμα. Υπάρχει μόνο ένα διαθέσιμο κανάλι.
         Το κόστος αποστολής είναι 0.1 Euro.
         Αν μόνο ο Πράσινος στείλει το μήνυμα του, θα έχει κέρδος 1 Euro.
         Αν και ο Πράσινος και ο Μπλε στείλουν μήνυμα, το κανάλι θα μπλοκάρει και κανένα μήνυμα δεν θα περάσει.

(0,0)
(0,0.9)
(0.9,0)
(-0.1,-0.1)

Το κοινό στοιχείο σε όλα αυτά τα παραδείγματα είναι ότι αν ο καθένας δράσει συνεργατικά θα υπάρξει το καλύτερο αποτέλεσμα. Δυστυχώς σχεδόν όλοι σκέφτονται μόνο το προσωπικό συμφέρον, με αποτέλεσμα να οδηγηθούν σε μη επιθυμητά αποτελέσματα. 


Η Ισορροπία Nash έχει δώσει αλματώδη ανάπτυξη στη θεωρία παιγνίων όπου
έχει μεγάλη γκάμα εφαρμογών. Θα λέγαμε πως όλα έχουν κάποια σχέση με την θεωρία παιγνίων αφού έχει εφαρμογές στην οικονομία, στις επιχειρήσεις, στην πληροφορική, στις τηλεπικοινωνίες, στην πολιτική, στην κοινωνιολογία, στη βιολογία και φυσικά στην καθημερινότητα. Μια σύγχρονη μαθηματική θεωρία μπορεί να αναλύσει κάθε είδος αναμέτρησης, από την ντάμα και το σκάκι μέχρι τον τζόγο ή έναν πυρηνικό πόλεμο, και να προβλέψει τον νικητή.
Στα τέλη της δεκαετίας του 1990 η θεωρία παιγνίων εφαρμόστηκε στον σχεδιασμό δημοπρασιών. Πάνω σε αυτό ασχολήθηκαν διάφοροι επιστήμονες για την κατανομή δικαιωμάτων χρήσης του ηλεκτρομαγνητικού φάσματος στη βιομηχανία των κινητών τηλεπικοινωνιών.
Στη βιολογία η θεωρία παιγνίων χρησιμοποιήθηκε για να εξηγήσει την εξέλιξη(και την σταθερότητα) της αναλογίας 1 προς 1 στα φύλα.
Στην πολιτική για παράδειγμα αυτό το παίγνιο χρησιμοποιείται για να επεξηγήσει το πρόβλημα που έχουν δύο κράτη με την απόκτηση όπλων. Υπάρχουν δύο στρατηγικές επιλογές για τα κράτη: είτε να αυξήσουν την στρατιωτική τους δύναμη και να αγοράσουν καινούριο εξοπλισμό, είτε να κάνουν μια συμφωνία έτσι ώστε να μειώσουν την χρησιμοποίηση όπλων. Κανένα κράτος δεν είναι βέβαιο ότι το άλλο θα κρατήσει την υπόσχεση του και επομένως και τα δύο κλίνουν στο να αγοράσουν τελικά τα όπλα. Παράδειγμα για αυτήν την περίπτωση αποτελεί η διαμάχη Αμερικής -Ρωσίας τη δεκαετία του 50(όταν πρωτομελετήθηκε το συγκεκριμένο παίγνιο) για την απόκτηση πυρηνικού εξοπλισμού.

Επίσης στον αθλητισμό πολλοί παλαιστές καταφεύγουν στο χάσιμο πολλών κιλών με σκοπό να διαγωνιστούν με ελαφρύτερους αντιπάλους , πηγαίνοντας στην μικρότερη κατηγορία. Αυτό μπορεί να το κάνουν πολλοί διαγωνιζόμενοι με αποτέλεσμα να υποβαθμίζεται ο συναγωνισμός. Ακόμη όμως και αν κάποιος διαγωνιζόμενος παραμείνει στο αρχικό του βάρος, είναι πολύ πιθανό να συναγωνιστεί κάποιον που έχει χάσει αρκετό βάρος.


Διάφορα Παίγνια
         Φτηνές υπεραστικές κλήσεις μετά τις 23:00 και συμφόρηση γραμμών. Πότε να πάρω  τηλέφωνο, πριν ή μετά τις 23:00?
         Γιατί στα στρατόπεδα συγκέντρωσης οι έγκλειστοι δεν επιτέθηκαν στου φρουρούς?
         Κανείς δεν θέλει να είναι στην πρώτη γραμμή σε μια διαδήλωση, αν όμως δεν σχηματιστεί πρώτη γραμμή δεν θα υπάρχει διαδήλωση.
Υπάρχουν παιχνίδια που έχουν παραπάνω από μία ισορροπίες Nash, ενώ υπάρχουν και παιχνίδια χωρίς κανένα σημείο ισορροπίας Nash.

*      Θεωρία Παιγνίων: Η μαθηματική θεωρία της σύγκρουσης και της συνεργασίας
*       Ότι είναι η Θεωρία Πιθανοτήτων για τα παίγνια τύχης, είναι η Θεωρία Παιγνίων για τα στρατηγικά παίγνια

Για να κατανοήσουμε πλήρως την έννοια της ισορροπίας Nash, θα χρησιμοποιήσουμε πάλι το πιο πάνω παίγνιο το οποίο παραθέτουμε πάλι για ευκολία.

Πίνακας 2.1 Παίγνιο κυριαρχίας κινδύνου “Risk Dominance” [35]

 

Ξεκινώντας με τον Α παίκτη βρίσκουμε ποια στρατηγική θα επιλέξει σε συγκεκριμένη στρατηγική του αντιπάλου. Έστω ότι ο Α πιστεύει ότι ο Β θα επιλέξει την β1 στρατηγική. Τότε προφανώς θα επιλέξει εκείνη από τις δύο δικές του στρατηγικές που θα του δώσει το μεγαλύτερο όφελος. Η α1 θα του δώσει 5 μονάδες ωφέλειας, ενώ η α2 θα του δώσει 0(όπως αναφέραμε και πιο πριν οι πρώτοι αριθμοί σε κάθε κελί αντιστοιχούν στον παίκτη γραμμής, δηλαδή στον Α). Άρα θα επιλέξει την α1 στρατηγική με κέρδος 5. Αυτό το νούμερο το κυκλώνουμε. Αν ο Α πιστεύει πως ο Β θα διαλέξει την β2 στρατηγική αυτός φυσικά θα προτιμήσει την α2 αφού το κέρδος του θα είναι μεγαλύτερο(-100<0), άσχετα αν πρόκειται για 0 μονάδες.

Ύστερα από τις επιλογές του παίκτη Α, ο πίνακας παρουσιάζεται ως εξής:


Πίνακας 2.2 Πρώτο στάδιο του παιγνίου

 

Ομοίως κάνουμε και για τον παίκτη Β. Αν αυτός νομίζει ότι ο Α θα επιλέξει την α1 στρατηγική, θα προτιμήσει την β1 στρατηγική που θα του δώσει κέρδος 5 μονάδες και όχι 4 μονάδες(οι δεύτεροι αριθμοί σε κάθε κελί είπαμε πως αναφέρονται στον παίκτη στήλης, δηλαδή στον Β). Αν ο Β νομίζει για τον Α πως θα ακολουθήσει την α2 στρατηγική, θα προτιμήσει και πάλι την β1 αφού θα έχει κέρδος 1 μονάδα αντί για 0 μονάδες. Αυτά τα νούμερα τα βάζουμε σε ένα μπλε τετράγωνο.

Ύστερα και από τις επιλογές του Β παίκτη ο πίνακας έχει ως εξής:


Πίνακας 2.2 Δεύτερο στάδιο του παιγνίου

 

Η ισορροπία Nash υπάρχει όταν η καλύτερη απόκριση του παίκτη Α είναι ίδια με την καλύτερη απόκριση του παίκτη Β, όταν δηλαδή σε ένα κελί υπάρχουν οι επιλογές και των δύο παικτών. Αυτό είναι και το σημείο ισορροπίας. Στο παράδειγμα μας ισορροπία έχουμε στο κελί (α1, β1)=(5, 5).

ΔΙΑΦΑΝΕΙΕΣ ΠΑΡΟΥΣΙΑΣΗΣ

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου