Ψάχνεις κάτι συγκεκριμένο;

23 Νοεμβρίου 2016

Προγράμματα Ανταμοιβών

Continuous Reinforcement Schedule – CRF

Προγράμματα Ανταμοιβών

Ο Μπ. Φ. Σκίνερ μαζί με μια ομάδα ερευνητών, ανέπτυξαν την θεωρία των «Προγραμμάτων Ανταμοιβών» («Reinforcement Schedule») για να εξηγήσουν τους κανόνες με τους οποίους ένα ζώο (στη δική μας περίπτωση, ένας σκύλος) θα πρέπει να ανταμείβεται όταν κάνει κάτι σωστά. Μαζί με την ερευνητική του ομάδα, μελέτησαν και έβγαλαν συμπεράσματα για το πότε μια συμπεριφορά δυναμώνει, ελαττώνεται ή καταστρέφεται εντελώς σε σχέση με τη συχνότητα ανταμοιβής. Στις επόμενες ενότητες θα αναλύσουμε τα διάφορα προγράμματα ανταμοιβών, τι κάνει το καθένα, ποια είναι τα δυνατά και ποια τα αδύναμα του σημεία.

 

Πρόγραμμα Συνεχόμενης Ανταμοιβής (Continuous Reinforcement Schedule)

Στο Πρόγραμμα Συνεχόμενης Ανταμοιβής (αναφερόμενο στην αγγλική ορολογία ως Continuous Reinforcement Schedule – CRF) ο σκύλος ανταμείβεται κάθε φορά που κάνει τη ζητούμενη συμπεριφορά. Το χρησιμοποιούμε μόνο κατά τη διάρκεια που ο σκύλος μαθαίνει μια νέα συμπεριφορά.

Θετικά: Από τη στιγμή που υπάρχει μια σχέση 1 προς 1 συμπεριφοράς και ανταμοιβής, ο σκύλος μαθαίνει γρήγορα τι είναι αυτό που του ζητάμε.
Αρνητικά: Δεν είναι ικανό να διατηρήσει μια συμπεριφορά σε βάθος χρόνου.

 

Πρόγραμμα Σταθερής Αναλογίας (Fixed Ratio Schedule)

Στο Πρόγραμμα Σταθερής Αναλογίας (αναφερόμενο στην αγγλική ορολογία ως Fixed Ratio Schedule – FRx) ο σκύλος ανταμείβεται κάθε x φορές που κάνει τη ζητούμενη συμπεριφορά.

Θετικά: Η συμπεριφορά γίνεται πιο ανθεκτική στη μη παροχή ανταμοιβής.
Αρνητικά: Μετά από κάποιο χρονικό διάστημα, ο σκύλος θα καταλάβει πως «ανταμείβομαι κάθε x φορές». Αυτό θα τον κάνει να μη προσφέρει τη σωστή συμπεριφορά αν οι x φορές είναι πολλές ή η συμπεριφορά είναι πολύ δύσκολη.

Παράδειγμα: Στο FR3, ο σκύλος ανταμείβεται κάθε 3 φορές. Έτσι αν του ζητήσουμε 12 φορές να κάνει το «κάτσε», οι ανταμοιβές του θα είναι οι εξής (σημειώνονται με πράσινη σκιαγράφηση):

 

 

Πρόγραμμα Μεταβλητής Αναλογίας (Variable Ratio Schedule)

Στο Πρόγραμμα Μεταβλητής Αναλογίας (αναφερόμενο στην αγγλική ορολογία ως Variable Ratio Schedule – VRx) ο σκύλος ανταμείβεται κάθε x φορές ανά μέσο όρο όταν κάνει τη ζητούμενη συμπεριφορά.

Θετικά: Η τυχαιότητα παροχής ανταμοιβών είναι τόσο καλή που ο σκύλος δεν μπορεί να προβλέψει πότε θα είναι η επόμενη. Αυτό το καθιστά το ιδανικότερο πρόγραμμα για τη διατήρηση μιας συμπεριφοράς σε βάθος χρόνου.
Αρνητικά: Πρέπει να προσέξουμε το x (στο VRx) να μην είναι πολύ μεγάλο, για να μην βαρεθεί ο σκύλος και εγκαταλείψει.

Παράδειγμα: Στο VR3, αν ζητηθεί από τον σκύλο να κάνει το «κάτσε» 30 φορές, τότε θα ανταμειφθεί 10 φορές (30 / 3 = 10). Οι ανταμοιβές θα δίνονται κατά μέσο όρο κάθε 3 φορές, έτσι θα κατανεμηθούν ως εξής (σημειώνονται με πράσινη σκιαγράφηση):

 

 

Πρόγραμμα Σταθερών Διαστημάτων (Fixed Interval Schedule)

Στο Πρόγραμμα Σταθερών Διαστημάτων (αναφερόμενο στην αγγλική ορολογία ως Fixed Interval Schedule – FΙx) ο σκύλος ανταμείβεται κάθε x χρονικές μονάδες (π.χ. δευτερόλεπτα, λεπτά ή σε ό,τι άλλο δουλεύουμε), όσο διατηρεί τη ζητούμενη συμπεριφορά. Αυτό το πρόγραμμα χρησιμοποιείται για τις περιπτώσεις που θέλουμε να χτίσουμε διάρκεια σε μια συμπεριφορά. Για παράδειγμα «Κάνε το κάτσε μέχρι να σου δώσω κάποια άλλη εντολή».

Θετικά: Η συμπεριφορά γίνεται πιο ανθεκτική στη μη παροχή ανταμοιβής.
Αρνητικά: Μετά από κάποιο χρονικό διάστημα, ο σκύλος θα καταλάβει πως «ανταμείβομαι κάθε x δευτερόλεπτα». Αυτό θα τον κάνει να μην προσφέρει τη σωστή συμπεριφορά αν τα x δευτερόλεπτα είναι πολλά ή η συμπεριφορά είναι πολλή δύσκολη.

Παράδειγμα: Στο FI2 δευτερολέπτων, ο σκύλος ανταμείβεται κάθε 2 δευτερόλεπτα. Έτσι αν του ζητήσουμε να κάνει το «κάτσε» για 12 δευτερόλεπτα, οι ανταμοιβές του θα είναι οι εξής (σημειώνονται με πράσινη σκιαγράφηση):

 

 

Πρόγραμμα Μεταβλητών Διαστημάτων (Variable Interval Schedule)

Στο Πρόγραμμα Μεταβλητών Διαστημάτων (αναφερόμενο στην αγγλική ορολογία ως Variable Interval  Schedule – VIx) ο σκύλος ανταμείβεται κάθε x χρονικές μονάδες (δευτερόλεπτα, λεπτά ή σε ό,τι άλλο δουλεύουμε) ανά μέσο όρο, όσο διατηρεί τη ζητούμενη συμπεριφορά. Αυτό το πρόγραμμα χρησιμοποιείται για τις περιπτώσεις που θέλουμε να χτίσουμε διάρκεια σε μια συμπεριφορά. Για παράδειγμα «Κάνε το κάτσε μέχρι να σου δώσω κάποια άλλη εντολή».

 

Θετικά: Η τυχαιότητα παροχής ανταμοιβών είναι τόσο καλή που ο σκύλος δεν μπορεί να προβλέψει πότε θα είναι η επόμενη. Αυτό το καθιστά το ιδανικότερο πρόγραμμα για τη διατήρηση μιας συμπεριφοράς σε βάθος χρόνου.
Αρνητικά: Πρέπει να προσέξουμε το x (στο VIx) να μην είναι πολύ μεγάλο, για να μην βαρεθεί ο σκύλος και εγκαταλείψει.

Παράδειγμα: Στο VΙ3, αν ζητηθεί από τον σκύλο να κάνει το «κάτσε» για 30 δευτερόλεπτα, τότε θα ανταμειφθεί 10 φορές (30 / 3 = 10). Οι ανταμοιβές θα δίνονται κατά μέσο όρο κάθε 3 δευτερόλεπτα, έτσι θα κατανεμηθούν ως εξής (σημειώνονται με πράσινη σκιαγράφηση):

 

Share it!