Teori Operant Conditioning Skinner

1. Definisi Operant Conditioning

Sebenarnya operant conditioning itu apa sih?

Operant conditioning, atau teori Skinner, adalah pengondisian yang melibatkan respons sukarela dari orang/subyek yang dikondisikan.

Berbeda dari classical conditioning, yang hasilnya adalah perilaku refleks/tanpa sadar, respon dari pengondisian operant adalah pilihan dari si subyek itu sendiri.

Misalnya berkendara nih. Kamu pake helm/sabuk karena peraturan. Kalo peraturan dilanggar, kamu akan mendapat hukuman. Hukuman ini adalah salah satu bentuk operant conditioning (kita bahas ntar).

Dalam operant conditioning, respon yang menguat/melemah dilihat dari seberapa sering respon ini terulang. Misalnya kamu pake helm cuma kalo ada polisi, ya berarti respon dari operant kamu kurang kuat. Tapi kalo misalnya sampe mandi atau tidur pun tetep pake helm, berarti responnya terlalu kuat.

Ini juga alasannya kenapa disebut “operant”, karena meskipun dikondisikan, proses pengkondisian hanya akan berhasil kalo si subyek ikut “beroperasi” dalam pengkondisian.

Skinner (1938) menulis bahwa:

“Operant conditioning is a method of learning that occurs through rewards and punishments for behaviour. Through operant conditioning, an individual makes an association between a particular behaviour and a consequence”.

Pengondisian operan adalah metode pembelajaran yang terjadi melalui reward dan punishment pada perilaku. Melalui pengondisian operan, seorang individu membuat hubungan antara perilaku tertentu dan konsekuensinya (Skinner, 1938).

2. Sejarah dan Perkembangan Pengondisian Operan

Operant conditioning pertama kali dikemukakan oleh B.F. Skinner. Sebagai behavioris, Skinner percaya bahwa untuk memaknai perilaku, kita nggak perlu membaca pikiran pelakunya.

Skinner menyarankan, penyebab eksternal juga bisa menjelaskan alasan suatu perilaku.

Emang sebenernya behavioristik adalah aliran pemikiran pertama dalam psikologi. Awal abad ke-20 pun behaviorisme adalah kekuatan utama, dengan John B. Watson sebagai pionirnya.

Watson sendiri sangat berfokus pada pengondisian klasik, pengondisian yang meyakini bahwa perilaku belajar kita dibentuk sebagai respons terhadap stimulus (kalo lupa, cek di sini yes).

Saat John Watson meninggalkan dunia akademik, dan ilmuwan behavioristik lainnya mulai bermunculan dan menawarkan bentuk-bentuk belajar baru selain classical.

Skinner menilai pengondisian klasik kelewat sederhana untuk menjelaskan perilaku manusia yang kompleks. Perbuatan manusia bukan cuma respons terhadap lingkungan, tapi juga bisa menjadi bentuk proaktif untuk mencapai harapan tertentu. Ia menyebut pendekatan ini dengan pengkondisian operan.

Walaupun dianggap sebagai bapak yang melahirkan (???) Pengondisian Operan, tapi sebenernya pendekatan ini terinspirasi dari teori Thorndike. Teori Thorndike, yang juga disebut law of effect, menyebut bahwa perilaku yang menghasilkan kenikmatan cenderung akan diulangi, sementara perilaku yang menghasilkan kepedihan akan dihindari.

Gampangnya sih, manusia mencari nikmat dan menghindari kepedihan.

B.F. Skinner kemudian menggunakan inspirasi dari Thorndike ini sebagai dasar teorinya.

Bisakah kita menggiring suatu organisme melakukan perilaku yang kita inginkan, dengan memanipulasi nikmat dan sengsara?

3. Bagaimana Cara Kerja Operant Conditioning?

Manusia mencari kenikmatan dan menghindari kepedihan. Insting ini ada pada setiap manusia, dan operant conditioning membantu kita memahami proses ini lebih lanjut.

Sekarang kita bahas gimana cara kerja operant conditioning. Termasuk apa aja yang bisa memengaruhi terbentuknya perilaku, dan berapa lama suatu perilaku bisa bertahan.

3.2 Tiga istilah dasar dalam pengkondisian operan

Jadi gimana cara pengkondisian operan bekerja?

Skinner menyebut ada tiga jenis stimulus yang terjadi setelah suatu perilaku. Ada stimulus netral, reinforcement alias penguat, dan punishment alias hukuman.

• Netral: Stimulus dari lingkungan yang tidak menambah atau mengurangi kemungkinan perilaku diulang.

• Reinforcement/penguat: Stimulus dari lingkungan yang meningkatkan kemungkinan perilaku diulangi.

•Punishment/hukuman: Stimulus dari lingkungan yang mengurangi kemungkinan perilaku diulang.

Dihukum dan dipuji adalah bagian dari kehidupan kita. Respon dari orang lain juga membentuk kita dan gimana kita berperilaku.

Kamu mungkin pernah kenal temen yang ngerokok karena dianggap keren dan jantan sama temen-temennya. Mungkin hisapan pertamanya mengundang pujian dan tepuk tangan dari temen gengnya. Pujian dan tepuk tangan ini adalah reinforcement positif, dan ini bikin temen kamu itu jadi perokok.

Atau bisa jadi dia ngerokok karena takut dikira cemen atau penakut. Ketika dia menolak rokok, dia dikatain lemah, cemen, dan semacemnya. Perlakuan negatif ini memancing dia untuk ngerokok. Takut diledek ini adalah reinforcement negatif, yang bikin dia ngudud.

Tapi mungkin ada juga anak lain yang berhenti ngerokok setelah ketahuan orang tua dan “dibelai” pake ikat pinggang bapaknya di rumah. Hukuman ini mungkin bisa bikin seseorang kapok lalu berhenti merokok.

Oke, jadi kamu udah tau tentang netral, reinforcement, dan punishment. Ini adalah basic yang perlu kamu pahami sebelum kita bahas lebih jauh.

Abis ini kita akan bahas printilan operant conditioning secara lebih detail. Kalo capek kamu boleh minum atau buka sosmed bentar.

Untuk menjelaskan teori Skinner ini lebih lanjut, kita akan bahas penelitian yang dilakukan sama B.F. Skinner ini sendiri. Jadi dia menggunakan seekor tikus dalam kotak penelitiannya, yang dia sebut kotak Skinner.

3.3 Penjelasan lebih lanjut: Skinner dan Penelitiannya

3.3.1. Reinforcement

Positive reinforcement

Skinner menunjukkan cara kerja reinforcement positif dengan menempatkan seekor tikus lapar di kotak Skinner-nya.

Di dalam kotak itu ada tuas , dan waktu tikus itu bergerak di sekitar kotak, secara nggak sengaja badannya menyenggol tuas. Saat tuas berpindah posisi, makanan akan jatuh ke wadah di sebelah tuas.

Reinforcement positif ini dipelajari dengan cepet setelah beberapa kali makanan datang. Berkat adanya makanan yang jatuh setelah tuas tertekan, tikus jadi mengulang tindakan serupa terus menerus.

Reinforcement positif ini kadang disebut juga sebagai reward.

Negative Reinforcement

Skinner menunjukkan bagaimana reinforcement negatif bekerja menggunakan tikus di kotak Skinner-nya. Bedanya, kotak ini dialiri arus listrik kecil yang nggak nyaman. Saat tikus bergerak dan menyenggol tuas, arus listrik ini berhenti mengalir.

Tikus kemudian mulai memahami hal ini, dan segera setelah kotak dialiri arus listrik lagi, tikus udah tau apa yang harus dilakukan, dan ia menekan tuas.

Reinforcement negatif di sini adalah arus listrik yang nggak nyaman, dan tuas yang menyelamatkan hidup si tikus membuat dia mengulangi tindakan ini terus menerus.

Malah Skinner juga menambahkan tantangan baru: di kotak ini, ada lampu yang akan nyala sebagai tanda kalo arus listrik akan segera dihidupkan. Tikus di kotak mulai menyadari hal ini, dan akan segera menekan tuas setelah lampu menyala. Jadi listriknya nggak sempet mengaliri kotak.

Respons ini kemudian disebut sebagai Belajar Avoidant.

3.3.2. Punishment

Hukuman atau punishment dalam teori Skinner adalah memberikan sebuah stimulus dengan tujuan menghilangkan atau mengurangi munculnya suatu perilaku.

Bahasa gampangnya: memberikan sesuatu yang bikin kapok, sehingga si pelaku nggak mengulangi suatu perbuatan lagi.

Punishment sendiri ada dua: positif dan negatif.

Kok punishment positif dan negatif? Masa ada hukuman menyenangkan?

Punishment positif berarti kamu dikasih stimulus yang tidak menyenangkan, kalo punishment negatif berarti ada sesuatu yang menyenangkan yang diambil (punishment negatif).

Contohnya kalo misalnya kamu telat bayar SPP. Kemungkinan hukumannya adalah bayar denda, atau kalo nggak ya kamu nggak boleh masuk ke kelas. Denda di sini adalah memberikan stimulus yang tidak menyenangkan, dan nggak boleh masuk kelas adalah menghilangkan stimulus yang menyenangkan.

Walaupun saya ragu kalo kuliah itu stimulus menyenangkan, tapi kamu tau konsepnya lah ya.

Mungkin kamu mikir gini: apa bedanya reinforcement negatif dengan punishment?

Agak susah emang membedakan antara penguatan negatif dengan punishment. Secara konsep, penguatan negatif berfungsi menguatkan perilaku dengan cara negatif. Sementara punishment berfungsi melemahkan perilaku atau menghilangkan tertentu dengan cara yang tidak menyenangkan.

Reinforcement negatif berarti caranya tidak menyenangkan, tapi membuat perilaku makin kuat.

Sementara punishment, berarti caranya tidak menyenangkan, tapi pelakunya kapok, sehingga perilaku menghilang.

Yang bikin bingung adalah punishment dan reinforcement negatif ini bisa subyektif, tergantung persepsi subyek yang mendapatkannya.

Masuk penjara misalnya. Penjara itu hukuman apa reinforcement negatif hayooo?

Seorang terpidana mungkin kapok sama penjara. Dia berjanji kalo bebas nanti dia bakal berubah.

Tapi terpidana lain mungkin malah belajar banyak di dalam jeruji besi. Yang tadinya cuma nyolong daleman, mungkin ketemu temen lapas yang bisa nyongkel ATM atau penjagal. Masuk penjara malah bikin networkingnya tambah luas, dan mungkin dia malah terinspirasi untuk bikin kejahatan yang lebih ekstrim.

Tapi saya nggak bilang kalo penjara itu buang-buang duit pemerintah. Yang saya soroti adalah definisi punishment dan reinforcement negatif bisa berubah tergantung ke perspektif si subyek.

Dan punishment sendiri punya beberapa masalah lain, misalnya:

  • Perilaku yang dihukum sebenarnya nggak 100% hilang, tapi direpresi - perilaku ini bisa balik lagi kalo hukumannya nggak ada. Mantan penjahat mungkin bisa balik jadi jahat kalo di dunia nggak ada penjara lagi.
  • Bisa meningkatkan agresi. hukuman seringkali menggunakan agresi, jadi agresi bakal dianggap solusi mengatasi masalah.
  • Bisa memunculkan efek samping. Hukuman guru yang terlalu keras bisa bikin siswa gak mau sekolah lagi.

Prinsip hukuman memang mengarahkan subyek untuk tidak melakukan suatu perilaku. Nggak boleh merokok. Nggak boleh nggak pake helm. Nggak boleh melanggar lampu lalu lintas.

Kalo kita mau mengondisikan subyek, kita nggak bisa cuma ngasi hukuman. Kita perlu mengarahkan subyek ke respons yang kita inginkan.

Kalo sekolah mau siswanya dateng on time, jangan cuma ngasi hukuman saat telat. Kasi juga apresiasi kalo mereka dateng tepat waktu.

Apresiasi, imbalan, atau hadiah adalah reinforcement, yang akan efektif dalam pengondisikan subyek.

Tapi ternyata sekedar ngasi reinforcement juga nggak cukup. Ada aspek lain yang perlu diperhatikan. Apakah gerangan?

Kamu boleh lemesin kaki sama leher, kita akan jawab setelah yang satu ini.

3.3.3. Penjadwalan reinforcement

Reinforcement memang manjur dalam menguatkan perilaku, tapi ada satu hal lain yang juga memengaruhi efektivitasnya.

Misalnya orang yang kerja karena berharap digaji. Kalo ternyata gaji (reinforcement) nggak dikasih, apa dia masih bakal masuk kerja?

Menghilangnya perilaku yang diharapkan ini disebut kepunahan.

Behaviourists menemukan bahwa penjadwalan reinforcement punya dampak pada seberapa cepat pengondisian terjadi, dan seberapa cepat pengondisian punah.

Ferster dan Skinner (1957) menemukan bahwa perbedaan timing dalam memberikan reinforcement akan menghasilkan dampak yang berbeda pula.

Ada dua macam perlakuan reinforcement yang dilakukan. Namanya adalah:

  • Penguatan Berkelanjutan (Continuous Reinforcement)
  • Penguatan Parsial (Partial Reinforcement)

Di dalam Penguatan Parsial ini ada pembagiannya lagi:

  • Penguatan Rasio Tetap (Fixed Ratio Reinforcement)
  • Penguatan Rasio Variabel (Variable Ratio Reinforcement)
  • Penguatan Interval Tetap (Fixed Interval Reinforcement)
  • Penguatan Interval Variabel (Variable Interval Reinforcement)

Ada juga yang nggak pake istilah penguatan parsial. Jadi langsung menyebut lima macam penguatan. Ada yang bilang dua, parsial dan berkelanjutan, terus parsialnya ada empat macam.

Setiap penjadwalan reinforcement punya perbedaan di konsistensi waktu dan pemberiannya, dan ini punya dampak pada seberapa cepat perilaku “menancap” di otak subyek, dan seberapa cepat perilaku terlupakan.

Penguatan Berkelanjutan

Tikus dikasi reinforcement positif segera setiap kali perilaku terjadi. Misalnya kalo di Skinner, tiap kali tikus menekan tuas, makanan akan dikirim.

Contoh lain adalah pelatih sirkus yang selalu ngasih makanan setiap hewannya berhasil melakukan trik. Kalo hewan melakukan trik (perilaku) beberapa kali tapi ternyata berhenti dikasi makanan (nggak dikasi reinforcement), maka hewan nggak nurut lagi (kepunahan).

Penguatan selalu muncul setelah perilaku.

  • Tingkat responsnya lambat (Susah jadi kebiasaan)
  • Tingkat kepunahan cepat (Cepet terabaikan)

Penguatan Parsial

Bagian ini mungkin mulai susah dihafal dan dipahami. Supaya lebih gampang dimengerti, mungkin kita mulai dari definisi super singkatnya:

  • Rasio maksudnya dikasih reinforcement atau nggak.
  • Interval maksudnya pasti dikasih reinforcement tapi waktunya kapan.
  • Tetap berarti konsisten.
  • Variabel berarti berubah-ubah.

Penguatan Rasio berarti dikasih reinforcement atau nggak.

Kalo rasio tetap berarti: setiap beberapa perilaku pasti dikasih reinforcement, rasio variabel berarti setiap beberapa kali perilaku belum tentu dapet reinforcement.

Kalo interval berarti pasti dikasih, tapi kapan.

Interval tetap berarti waktunya tetap, kalo interval variabel berarti waktunya ngacak.

Istilahnya banyak dan mulai ribet ya? Hehehe~

Saya jelasin dikit lagi deh, biar makin nancep. Oke, kita mulai!

Penguatan Rasio Tetap

Penguatan diberikan setelah perilaku terjadi beberapa kali. Misalnya, satu penguatan setiap lima kali respons yang benar.

Contohnya, seorang sales hape yang dapat bonus setiap berhasil menjual sepuluh hape. Meskipun katakanlah dia hari ini gagal menjual hape (perilaku nggak mendapat reinforcement), besok dia akan mencoba menjual lagi (perilaku tetap dilakukan).

Penguatan muncul setelah perilaku dilakukan beberapa kali.

  • Tingkat responsnya cepat
  • Tingkat kepunahannya menengah

Penguatan Rasio Variabel

Perilaku mendapat penguatan secara tak terduga setelah beberapa kali percobaan. Contohnya judi. Setelah mencoba judi beberapa kali dan kalah (perilaku tidak mendapat penguatan), akhirnya di percobaan keempat kamu berhasil menang (penguatan). Ini bikin kamu penasaran dan mencoba judi lagi (perilaku diulang).

Perilaku dilakukan terus menerus, penguatannya muncul secara acak.

  • Tingkat responsnya cepat
  • Tingkat kepunahannya lamban

Kenapa penguatan rasio variabel punya tingkat kepunahan yang lamban? Ini kita bahas ntar di bawah yes.

Penguatan Interval Tetap

Reinforcement diberikan setiap kali perilaku terjadi, tapi dengan interval waktu tertentu. Misalnya orang kerja tiap hari, tapi gajinya baru dibayar setiap awal bulan.

Perilaku harus teratur, penguatannya baru muncul setelah beberapa waktu.

  • Tingkat responsnya menengah
  • Tingkat kepunahan menengah

Penguatan Interval Variabel

Penguatan pasti dikasih, tapi waktunya random. Contohnya, kuis dadakan, yang kalo nilainya bagus maka akan nambah nilai (reinforcement) di semesteran. Kuisnya dadakan (interval random), maka mahasiswa kudu belajar terus (perilaku) biar selalu siap.

  • Tingkat responsnya cepat
  • Tingkat kepunahan lamban

Skinner menemukan bahwa jenis reinforcement yang tingkat kepunahannya paling lambat adalah reinforcement berbasis variabel-rasio.

Kalo kepunahan (extinction) lambat, maka orang akan tetap mengulangi perilaku selama beberapa waktu, sebelum kemudian dia menyerah. Contoh lebih banyak akan kita bahas di bagian bawah ya.

4. Konsep-Konsep Dalam Operant Conditioning

Kita udah ngomongin definisi operant conditioning, macam-macam perlakuan di dalamnya, dan perbedaan jenis reinforcement di dalam operant conditioning.

Saya akan ngerefresh lagi sedikit tentang apa aja yang udah kita bahas dari tadi.

  • Operant conditioning adalah pengondisian yang melibatkan subyek dalam mengubah perilaku, menggunakan stimulus berupa reinforcement dan punishment.
  • Operant conditioning diciptakan oleh B.F. Skinner.
  • Dalam mengondisikan perilaku, operan conditioning menggunakan reinforcement dan punishment.
  • Reinforcement adalah penguat perilaku, bisa berupa positif dan negatif.
  • Reinforcement positif berarti menguatkan dengan cara menyenangkan: reward, apresiasi, dll.
  • Reinforcement negatif menguatkan dengan cara yang nggak menyenangkan: ancaman, peraturan, dll.
  • Punishment adalah pelemah atau penghilang perilaku. Caranya adalah dengan pemberian hukuman.
  • Punishment ada dua: positif dan negatif.
  • Punishment positif berarti diberikan sesuatu sebagai hukuman: disetrap, dimarahi.
  • Punishment negatif berarti diambil sesuatu sebagai hukuman: hape disita, dilarang masuk kelas.
  • Efektivitas reinforcement bisa bergantung pada timing atau penjadwalan.
  • Perilaku yang sudah dibentuk tapi berhenti dikondisikan akan perlahan memudar.
  • Penjadwalan reinforcement ada dua: Penguatan berkelanjutan dan penguatan parsial.
  • Penguatan berkelanjutan berarti selalu dikasih reinforcement setiap satu perilaku.
  • Penguatan parsial dibagi lagi menjadi empat: Penguatan rasio tetap, penguatan rasio variabel, penguatan interval tetap, penguatan interval variabel.
  • Rasio berarti reinforcement dikasih atau nggak.
  • Rasio tetap berarti tiap beberapa perilaku pasti dikasi reinforcement.
  • Rasio variabel berarti tiap beberapa perilaku belum tentu dikasi reinforcement.
  • Interval berarti pasti dikasih reinforcement tapi nggak tau kapan.
  • Interval tetap berarti waktu pemberian reinforcementnya tetap asalkan melakukan perilaku.
  • Interval variabel berarti terus melakukan perilaku tapi reinforcementnya ngacak, misalnya razia SIM STNK.

5. Teori Operant Conditioning dalam Kehidupan

Oke, kita udah ngerefresh lagi apa aja yang udah kita bahas sedari tadi.

Berhubung kamu udah mahir di teori dasar operant conditioning, berarti kamu siap mengamati bentuk operant conditioning dalam kehidupan sehari-hari. Bentuk-bentuk ini akan bikin kamu makin ngerti pengondisian operan dan bagaimana perilaku sosial kita tanpa sadar dipengaruhi oleh pengondisian ini.

Beberapa contoh pengondisian operan dalam kehidupan sehari-hari misalnya:

  • Anjing yang dilatih perilaku tertentu. Setiap dia berhasil melakukan satu trik dengan benar, dia dikasi reward berupa makanan.
  • Kalo bisa puasa penuh selama sebulan, nanti dibeliin sepeda.
  • Karyawan yang kerjanya lebih bagus kalo dijanjikan bonus.
  • Karyawan yang kerjanya lebih keras kalo diancam bakal dipecat.
  • Razia rambut di sekolah.
  • Kehadiran penuh di kelas bisa menambah nilai ujian. Hadir terus bisa menghindari nilai yang jelek (reinforcement negatif).
  • Kalo sering datang telat, dosen mungkin ngelarang kamu untuk ikut mata kuliah lagi. Hukuman ini bisa jadi motivasi kamu untuk menghilangkan kebiasaan telat kuliah.
  • Imbalan surga bikin seseorang rajin berbuat baik.

Untuk ngetes kemampuan kamu lebih jauh, coba deh kamu liat bentuk-bentuk penjadwalan reinforcement dari masing-masing contoh di atas. Mana yang masuk reinforcement berkelanjutan, rasio tetap, rasio variabel, interval tetap, dan interval variabel?

6. Kritik Terhadap Operant Conditioning

Meskipun tergolong teori jadul, operant conditioning masih menjadi pengondisian yang cukup laris digunakan.

Pengondisian Skinner mampu menjelaskan berbagai perilaku, proses pembelajaran, kehidupan sosial secara simpel.

Teori Skinner ini juga masih digunakan di ruang kelas, penjara, rumah sakit jiwa, dan lain-lain.

Tapi meskipun long-lasting dan banyak dipake, bukan berarti teori ini bebas kritik. Berikut ini beberapa kritik terhadap pengondisian operan.

Melewatkan Proses Kognitif

Yang pertama, teori ini alpa dalam mempertimbangkan proses mental dan kognitif dalam pembelajaran, memori, dan perilaku. Padahal ada proses berpikir dan memilih yang terjadi di dalam pembelajaran.

Misalnya logat bicara kita. Kamu mungkin berasal dari keluarga Jawa, tinggal di Jawa, dan punya logat Jawa yang kental. Apakah waktu kecil orang tuamu mengajarkan logat itu?

Atau makanan favorit kamu deh. Kamu mungkin lebih suka denger Nining Meida dibanding Isyana atau Ariana Grande, nggak kayak temen-temen kamu. Operant conditioning mungkin bisa menjelaskan perilaku yang dimotivasi sama faktor eksternal, tapi gimana dengan selera pribadi dan orang-orang yang bodo amat sama pendapat sekitarnya?

Simplisitas ini membuat upaya untuk memahami dan menjelaskan proses belajar pada manusia dan hewan menjadi kurang sempurna.

Outputnya Bisa Berbeda dari Rencana

Karena melewatkan dinamika berpikir, proses pendidikan operan kadang menghasilkan output yang beda dari harapan.

Berk (2012) pernah menulis tentang orang tua yang mencoba mengajarkan anak makan sayur. Caranya, tiap makan sayur maka akan dapet es krim. Niat awalnya mau bikin anak makan sayur, anak justru malah makin nggak suka!

Anak mungkin berpikir “kalo tiap mau makan sayur aja harus disogok, berarti sayur ini sesuatu yang nggak enak.”

Contoh lain adalah guru yang melarang mencontek waktu ujian. Alih-alih belajar keras, siswa justru malah mencoba cara yang lebih kreatif buat nyontek.

Tidak bisa digeneralisasi begitu saja kepada manusia

Kritik lain juga datang pendapat bahwa suatu teori nggak bisa digeneralisasi begitu aja ke manusia.

Apalagi teori ini datang dari eksperimen Skinner pada tikus dalam kotak. Anatomi dan fisiologi hewan berbeda dari manusia, dan harusnya teori ini nggak bisa diadaptasi begitu aja.

Tidak menanamkan kesadaran perilaku pada subyek

Meskipun efektif dalam mengarahkan perilaku, tapi pengondisian operan nggak menanamkan kesadaran perilaku pada subyek yang dikondisikan.

Kita bisa liat dari lima jenis reinforcement yang udah dibahas tadi. Ketika reinforcement berhenti dihapus, apa yang terjadi? Cepat atau lambat, akan terjadi kepunahan alias perilaku menghilang.

Lulus kuliah (reinforcement) hanya bisa didapat kalo kamu udah mengerjakan skripsi (perilaku). Apa yang terjadi kalo skripsi bukan syarat kelulusan? Apa kamu mau repot-repot mengerjakannya?

Semua kritik dan permasalahan di atas sebenernya mengarahkan kita ke satu kesimpulan; ada dinamika yang terjadi dalam diri dan pikiran seseorang, yang seringkali lebih kuat daripada pengondisian atau hukuman.

Untuk diterapkan ke manusia, pengondisian atau pembentukan perilaku juga harus melihat aspek lain. Misalnya ketertarikannya, kepribadiannya, kepercayaannya, atau hal-hal yang membuat dia jadi dia sekarang.

Pengkondisian operan udah ada sejak kita hidup sebagai makhluk sosial. Ini adalah sesuatu yang udah lama, dan Teori Skinner membantu kita memahami ini dan berpikir tentang apa aja kemungkinan dan potensi baru yang bisa diraih.

Memang pengondisian ini terlahir di era keemasan behavioristik (humanistik belum muncul), dan makin ke sini, operant conditioning makin dirasa kurang etis dan manipulatif. Melewatkan motivasi internal dan aspek-aspek lain dalam hidup seseorang tentu menghambat kita dalam memahami perilaku manusia seutuhnya, dan nggak meletakkan manusia dalam hakikatnya yang bisa berpikir dan merasa.

Berikutnya, kita akan bahas tentang gimana cara kita belajar tanpa reinforcement ataupun punishment dari orang lain. Kita akan bahas Social Learning Theory yes.

Referensi:

https://www.verywellmind.com/operant-conditioning-a2-2794863

https://www.simplypsychology.org/operant-conditioning.html

Feldman, R., 2019. Essentials Of Understanding Psychology. New York: McGraw-Hill Education.

Seel, N.M. ed., 2012. Encyclopedia of the Sciences of Learning.

Praveen Shrestha, “Operant Conditioning,” in Psychestudy, November 17, 2017, https://www.psychestudy.com/behavioral/learning-memory/operant-conditioning

https://www.learning-theories.org/doku.php?id=learning_theories:operant_conditioning

https://lumen.instructure.com/courses/170090/pages/problems-of-operant-conditioning