Rabu, 05 Oktober 2011

Pendekatan Dalam Psikodiagnostik 1

 ROLE OF THE CLINICIAN

 Peran sentral dari dokter harus melakukan penilaian untuk jawaban yang spesifik dari pertanyaan dan membantu dalam membuat keputusan yang relevan. Untuk memenuhi peran ini, dokter harus mengintegrasikan berbagai data dan fokus ke dalam berbagai bidang pengetahuan. Jadi,  mereka tidak hanya mengatur dan menilai tes. Perbedaan yang berguna untuk menekankan hal ini adalah perbedaan antara psychometrist dan dokter melakukan penilaian psikologis (Maloney & Ward, 1976; Matarazzo, 1990). Psychometris cenderung  menggunakan tes hanya untuk mendapatkan data .Pendekatan mereka terutama data yang berorientasi. Deskripsi ini biasanya berhubungan dengan konteks keseluruhan seseorang dan tidak mengatasi masalah yang unik. Sebaliknya, penilaian psikologis upaya untuk mengevaluasi individu dalam situasi masalah sehingga informasi yang berasal dari penilaian entah bagaimana dapat membantu dengan masalah. Tes hanya salah satu metode pengumpulan data, dan skor tes tidak produk akhir, melainkan hanya sarana untuk menghasilkan hipotesis. Maka penilaian psikologis adalah, tempat data dalam perspektif yang luas, dengan fokus pemecahan masalah dan pengambilan keputusan.
Perbedaan antara tes psikometri dan penilaian psikologis dapat lebih baik dipahami dan peran ideal dokter lebih jelas didefinisikan secara singkat menguraikan mengenai alasan historis dan metodologi untuk pengembangan pendekatan psikometrik. Keuntungan dari data berorientasi tes kecerdasan adalah bahwa mereka tampaknya obyektif, yang akan mengurangi bias pewawancara. Prediksi mereka umumnya akurat dan bermanfaat. Namun, ini menciptakan harapan awal bahwa semua penilaian dapat dilakukan dengan menggunakan metode yang sama dan akan memberikan tingkat akurasi yang sama dan kegunaan. Kemudian strategi penilaian sering mencoba untuk meniru metode sebelumnya tes inteligensi untuk variabel seperti kepribadian dan diagnosis psikiatri.
Sebuah pengembangan lebih lanjut sesuai dengan pendekatan psikometri adalah strategi menggunakan "tes baterai." Itu beralasan bahwa jika tes tunggal dapat menghasilkan deskripsi yang akurat dari kemampuan atau sifat, pemberian serangkaian tes dapat menciptakan gambaran keseluruhan orang tersebut. Tujuannya, kemudian adalah untuk mengembangkan global yang belum pasti, deskripsi untuk orang yang menggunakan metode yang benar-benar objektif. Tujuan ini mendorong gagasan bahwa alat (psikologis tes) adalah proses terbaik untuk mencapai tujuan, bukannya hanya satu teknik dalam prosedur penilaian secara keseluruhan. Di balik pendekatan ini adalah konsep dari ferences DIF sifat individu dan psikologi. Ini berasumsi bahwa salah satu cara terbaik untuk menggambarkan perbedaan antara individu adalah untuk mengukur kekuatan dan kelemahan sehubungan dengan berbagai sifat. Dengan demikian, pendekatan yang paling jelas untuk mempelajari kepribadian yang terlibat mengembangkan sebuah taksonomi yang relevan sifat dan kemudian membuat tes untuk mengukur sifat. Sekali lagi, ada penekanan pada alat sebagai primer, dengan penekanan pada masukan dari dokter. Kecenderungan ini menciptakan bias terhadap administrasi dan administrasi keterampilan. Dalam konteks ini, psychometrist memerlukan sedikit keahlian klinis lainnya dari administrasi, mencetak, dan menafsirkan tes. Menurut pandangan seperti itu, tes yang paling disukai akan menjadi mesin-mencetak benar-salah atau pilihan ganda yang dibangun sehingga bahwa skor bernorma, daripada psychometrist, memberikan penafsiran.
Pendekatan psikometri merupakan tujuan yang paling tepat diterapkan untuk tes kemampuan seperti mengukur kecerdasan  atau keterampilan mekanik. Kegunaannya menurun, namun ketika pengguna mencoba untuk menilai ciri-ciri kepribadian seperti ketergantungan, otoriterisme,  atau kecemasan, variabel-variabel kepribadian yang jauh lebih kompleks karena itu, perlu divalidasi dalam konteks sejarah, pengamatan perilaku, dan hubungan interpersonal. Sebagai contoh, skor T 70 pada skala MMPI-2 9 (mania) mengambil yang sama sekali berbeda makna bagi dokter berfungsi tinggi daripada seorang individu dengan  miskin riwayat pekerjaan dan hubungan interpersonal. Ketika objek dalam pendekatan psikometris benar-benar digunakan untuk evaluasi masalah dalam hidup (neurosis, psikosis, dll), kegunaannya dipertanyakan atau diragukan. Penilaian psikologis yang paling berguna dlam pemahaman dan evaluasi kepribadian terutama masalah dalam hidup. Isu ini melibatkan situasi masalah tertentu yang berkaitan dengan individu tertentu. Peran umum dari psikolog klinis adalah ahli dalam hal penilaian psikologis pada perilaku manusia yang berhubungan dengan proses yang kompleks dan memahami nilai-nilai test dalam konteks kehidupan seseorang. Psikolog klinis harus memiliki pengetahuan tentang berbagai masalah dan mengetahui dasar dari perilaku, dan di daerah mana mendapatkan data yang berhubungan. Hal iini melibatkan kesadaran dan apresiasi pada banyak sebab, pengaruh interaksi, dan multiple relationships. Woody (1980) mengatakan, “Penilaian klinis diorientasikan secara individual, selalu mempertimbangkan eksistensi sosial, bertujuan untk membantu orang memecahkan masalah.”
Psikolog klinis juga harus akrab dengan pengukuran dan praktek klinis, seperti statistik deskriptif, keakuratan data (standar error), validitas (rata-rata nilai skor), interpretasi normatif, peemilihan tes yang sesuai, prosedur administrasi, dan variabel yang berbeda (beragam, mencakup etnis, ras, usia, jenis kelamin), pengujian pada individu berkebutuhan khusus (Turner, DeMers, Fox, & Reed, 2001). Orang yang melakukan penilaian psikologis harus memiliki pengetahuan dasar yang berkaitan dengan tuntutan, jenis rujukan  pertanyaan, dan harapan dari berbagai konteks-terutama pekerjaan, pendidikan, kejuruan / karir, perawatan kesehatan (psikologis, psikiatri, medis), dan forensik. Selanjutnya, psikolog harus mengetahui hipotesis penafsiran utama dalam pengujian psikologis dan dapat mengidentifikasi, menyaring, dan mengevaluasi serangkaian hipotesis untuk menentukan yang paling relevan dan akurat. Untuk setiap penilaian, psikolog harus memahami konseptual apa yang mereka coba uji. Jadi, bukan hanya mengetahui label dan definisi untuk berbagai jenis gangguan kecemasan atau pikiran, psikolog juga harus mengetahui secara mendalam tentang mereka.
Pendekatan dalam psikodiagnostik ini konsisten dengan penilaian psikologis: psikolog tidak hanya mengetahuai tentang konten tradisional dalam psikologi dan berbagai konteks penilaian, tapi juga mampu menggabungkan data test pada deskripsi yang relevan dari orang tersebut. Deskripsi ini, meskipun berfokus pada individu, harus mempertimbangkan kompleksitas lingkungan sosial-nya, sejarah pribadi, dan pengamatan perilaku. Namun, tujuannya adalah bukan hanya untuk menggambarkan seseorang, melainkan untuk mengembangkan jawaban yang relevan dengan pertanyaan spesifik, bantuan dalam pemecahan masalah, dan memfasilitasi pengambilan keputusan.

PATTERNS OF TEST USAGE IN CLINICAL ASSESSMENT
Penilaian psikologis sangat penting untuk definisi, pelatihan, dan praktek profesional psikologi. 91% dari semua psikolog terlatih telibat dalam assessment (Watkins et al, 1995).
Penilaian psikologis mencakup berbagai kegiatan lebih dari sekedar administrasi dan interpretasi tes. Termasuk melakukan wawancara terstruktur dan tidak terstruktur, pengamatan perilaku, pengamatan interaksi interpersonal, penilaian neuropsikologis, dan penilaian perilaku. Ada  10 tes yang paling sering digunakan, yaitu : skala kecerdasan Wechsler, Minnesota Multiphasic Personality Inventory, Rorschach, Bender Visual Motor Gestalt, Thematic Apperception Test, projective drawings (Human Figure Drrawing, House-Tree-Person), Weschler Memory Scale, Back Depression Inventory, Millon Clinical Muliaxial Inventories, dan California Psychological Inventory (Camara et al, 2000;. Kamphaus, Petoskey, & Rowe, 2000; Lubin et al, 1985;. C. Piotrowskin & Zalewski, 1993; Watkins, 1991; Watkins et al., 1995).
Bentuk paling awal dari penilaian adalah melalui wawancara klinis. Psikolog seperti Freud, Jung, dan Adler menggunakan interaksi tidak terstruktur untuk memperoleh informasi mengenai sejarah, diagnosis, atau struktur yang mendasari kepribadian. Kemudian psikolog diajarkan wawancara dengan menyediakan garis besar daerah yang harus dibahas. Selama tahun 1960-an dan 1970-an, banyak kritik diarahkan ke wawancara, banyak psikolog terkemuka melihat wawancara sebagai validasi empiris dan kurang bisa diandalkan. Tes, dalam banyak hal, yang dirancang untuk melawan bias subjektivitas dan teknik wawancara. Selama tahun 1980-an dan 1990-an, berbagai macam teknik wawancara terstruktur mendapatkan popularitas dan sering telah ditemukan untuk menjadi indikator yang dapat dipercaya dan valid.
Selama tahun 1960-an dan 1970-an, terapi perilaku semakin banyak digunakan dan diterima. Awalnya, terapis behavior prihatin dengan pendekatan idiographic untuk analisis fungsional behavior. Seperti teknik-teknik mereka menjadi lebih canggih, metode penilaian behavior yang formal mulai muncul. Teknik ini sebagian muncul dari ketidakpuasan dengan Diagnostic and Statistical Manual of Mental Disorders, 2nd Edition (DSM-II; American Psychiatric Association, 1968) metode diagnosis dari kebutuhan untuk menilai hubungan secara langsung terhadap pengobatan dan hasil akhirnya . Ada juga keinginan untuk menjadi lebih bertanggung jawab untuk mendokumentasikan perubahan perilaku yang berubah sepanjang waktu. Sebagai contoh, jika perilaku yang berkaitan dengan kecemasan menurun setelah terapi, terapis harus mampu menunjukkan bahwa pengobatan telah berhasil. Penilaian perilaku bisa melibatkan pengukuran gerakan (daftar pemeriksaan perilaku, analisis perilaku), respon fisiologis (Kulit Response galvanic [GSR], Electromyograph [EMG]) atau laporan diri (self-monitoring, Beck Depression Inventory, skala asertif). Sedangkan teknik penilaian perilaku awal menunjukkan sedikit perhatian dengan sifat psikometrik instrumen mereka, telah ada dorongan peningkatan agar mereka memenuhi tingkat yang memadai reliabilitas dan validitas (First, Frances, Widiger, Pincus, & Davis, 1992; Follette & Hayes, 1992). Meskipun banyak tekhnik formal dari penilaian perilaku,banyak terapis behavior yang merasa bahwa pendekatan  idiographic terstruktur yang paling tepat.
Cara penilaian tradisional, mengalami penurunan, kemudian mengalami  kenaikan secara keseluruhan karena adanya kegiatan lain psikolog dan mereka melakukan perluasan atau ekspansi dalam mendefinisikan penilaian atau assessment itu. Saat ini, seorang psikolog melakukan penilaian yang mungkin termasuk dalam teknik seperti wawancara, administrasi, dan menafsirkan tes psikologi tradisional (MMPI-2 / MMPI-A, WAIS-III, dll), pengamatan yang alamiah, penilaian neuropsikologis, dan penilaian perilaku. Selain itu, psikolog profesional mungkin diperlukan untuk menilai daerah-daerah yang tidak diberi penekanan yang jauh sebelum tahun 1980-an seperti gangguan kepribadian (kepribadian narsisme), stres dan coping (perubahan hidup, kelelahan, mengatasi sumber daya yang ada), respon hipnotis, kesehatan psikologis, adaptasi terhadap budaya baru, dan perubahan yang terkait dengan peningkatan modernisasi. Area tambahan yang mungkin termasuk dalam sistem interaksi keluarga, hubungan antara seseorang dan lingkungan nya (iklim sosial, dukungan sosial), proses kognitif yang terkait dengan gangguan perilaku, dan tingkat kontrol pribadi (self-efficacy). Semua ini memerlukan petugas klinis untuk terus-menerus menyadari perangkat penilaian(assessment) yang baru dan lebih spesifik untuk mempertahankan fleksibilitas dalam pendekatan yang mereka ambil.
Masa depan penilaian psikologis mungkin akan sangat dipengaruhi oleh kecenderungan ke arah penilaian komputerisasi, adaptasi untuk mengelola pelayanan kesehatan, dan pengiriman kesehatan jarak jauh (Groth-Marnat, 2000b). Penilaian Komputerisasi mungkin untuk meningkatkan efisiensi melalui penilaian yang cepat, aturan-aturan keputusan yang kompleks, pengurangan di klien-praktisi kontak, presentasi novel rangsangan (yaitu, virtual reality), dan generasi hipotesis interpretatif. Masa Depan penilaian juga cenderung untuk menyesuaikan presentasi item berdasarkan tanggapan klien sebelumnya. Item yang tidak perlu tidak akan diberikan dengan salah satu hasil dimana sejumlah besar informasi akan diperoleh melalui presentasi item yang relatif lebih sedikit. Efisiensi waktu ini dalam bagian yang dirangsang oleh kebijakan penghematan biaya perawatan yang dikelola, yang membutuhkan psikolog untuk menunjukkan biaya-efektivitas pelayanan mereka (Groth-Marnat, 1999; Groth-Marnat & Edkins, 1996). Dalam penilaian, artinya menghubungkan penilaian dengan perencanaan pengobatan. Dengan demikian, laporan psikologis masa depan cenderung menghabiskan waktu yang relatif kurang pada dinamika klien dan lebih banyak waktu pada rincian yang terkait dengan strategi intervensi yang spesifik. Sedangkan bukti yang mendukung biaya-efektivitas penggunaan tes psikologis dalam konteks organisasi, perawatan kesehatan juga perlu menunjukkan penilaian yang dapat meningkatkan kecepatan pengobatan serta mengoptimalkan hasil pengobatan (lihat Groth-Marnat, 1999).
Tantangan yang lebih lanjut dan wilayah untuk perkembangan adalah peran penilaian akan bermain dalam kesehatan jarak jauh (Leigh & Zaylor, 2000; MA Smith & Senior, 2001). Ini mungkin sangat penting bagi pengguna fasilitas ini untuk diputar  dalam rangka untuk menyesuaikan intervensi secara optimal. Selain itu, jarak penilaian sebagai sarana dari dirinya sendiri kemungkinan akan menjadi penting juga. Hal ini mungkin memerlukan psikolog profesional untuk mengubah tradisional mereka secara tatap muka ke salah satu peran pengembangan dan pemantauan aplikasi baru serta konsultasi / berkolaborasi dengan klien tentang hasil penilaian yang berasal dari komputer.

EVALUATING PSYCHOLOGICAL TESTS
Sebelum menggunakan tes psikologis, petugas klinis harus menyelidiki dan memahami orientasi teoritis tes, pertimbangan praktis, standarisasi sampel, dan kecukupan realibitas dan validitas. Seringkali, membantu dideskripsikan dan ulasan yang berhubungan dengan isu-isu ini dapat ditemukan dalam edisi masa lalu dan masa depan Mental Measurements Yearbook (Impara & Plake, 1998), Pengujian di Print (L. Murphy, Impara, & Plake, 1999), Pengujian: Sebuah Referensi Komprehensif Penilaian di Psikologi, Pendidikan, dan Bisnis (Steve, 1997), dan Langkah-langkah untuk Clinical Practice: A Sourcebook (Corcoran, 2000). Ulasan juga dapat ditemukan dalam jurnal assessmentrelated seperti Journal of Personality Assessment, Journal Penilaian psychoeducational, dan Pengukuran Pendidikan dan Psikologis. Uji pengguna harus hati-hati meninjau manual yang menyertai ujian.
Tabel 1.1 menguraikan lebih penting pertanyaan yang harus dijawab. Isu-isu diuraikan dalam tabel ini akan dibahas lebih lanjut. Diskusi mencerminkan orientasi praktis dari teks ini dengan berfokus pada masalah petugas klinis yang menggunakan tes psikologis cenderung untuk menghadapinya. Hal ini tidak dimaksudkan untuk memberikan cakupan yang komprehensif dari teori tes dan konstruksi, jika pengobatan yang lebih rinci diperlukan, pembaca disebut salah satu dari banyak teks pada pengujian psikologis (misalnya, Anastasi & Urbina, 1997; R. Kaplan & Saccuzzo , 2001).

Tabel 1.1 Mengevaluasi tes psikologi
Orientasi teoritis
1.Apakah Anda cukup memahami konstruk teoritis tes ini yang seharusnya diukur?
2
.Apakah item tes sesuai dengan deskripsi konstruksi teoritis?

Practical          Considerations
1
. Jika membaca diperlukan oleh peserta ujian, apakah kemampuan-nya cocok dengan tingkat yang dibutuhkan oleh tes?
2.Apakah tepat panjang dari test?
 Standarisasi
1. Apakah populasi yang akan diuji mirip dengan standar populasi yang ada?
2. Apakah ukuran sampel standarisasi yang memadai?
3. Apakah norma-norma subkelompok khusus telah didirikan?
4. Apakah memadai melakukan instruksi yang mengizinkan pemberian standar?
 Reliability
1. Apakah perkiraan reabilitas yang cukup tinggi (umumnya sekitar 0,90 untuk pengambilan keputusan klinis dan sekitar 0,70 untuk tujuan penelitian)?
2. Implikasi apa stabilitas relatif dari sifat tersebut, memperkirakan metode validitas, dan format tes terhadap reabilitas?

Validity
1. Kriteria dan prosedur apa yang digunakan untuk memvalidasi tes?
2
. Akan menguji dan menghasilkan pengukuran yang akurat dalam konteks dan untuk tujuan yang
Anda ingin
menggunakannya?

Theoretical Orientation
Sebelum petugas klinis efektif dapat mengevaluasi apakah tes itu tepat, mereka harus memahami orientasi teoretis. Petugas klinis harus membangun penelitian bahwa tes seharusnya mengukur dan kemudian memeriksa bagaimana menguji pendekatan konstruksi ini (lihat S. Haynes, Richard, & Kubany, 1995). Informasi ini biasanya dapat ditemukan dites manual . Jika untuk alasan apapun informasi dalam manual tidak cukup, petugas klinisharus mencari tempat lain. Dokter sering dapat memperoleh informasi bermanfaat mengenai membangun diukur dengan hati-hati mempelajari item tes individu. Biasanya tes manual menyediakan item analisis individu, yang dapat membantu potensi pengguna tes mengevaluasi apakah mereka relevan dengan sifat yang diukur.

Practical Considerations
Sejumlah isu-isu praktis lebih berhubungan dengan konteks dan cara di mana tes ini
digunakan daripada konstruksi. Pertama, tes bervariasi dalam hal tingkat pendidikan (khususnya keterampilan membaca) bahwa peserta ujian harus memiliki untuk memahami mereka secara memadai. Para ujian harus mampu membaca, memahami, dan menanggapi tepat untuk menguji. kedua, beberapa tes yang terlalu panjang, yang dapat menyebabkan hilangnya hubungan dengan, atau frustrasi yang luas pada bagian dari, ujian tersebut. Penyelenggara bentuk pendek dari tes dapat mengurangi masalah ini, asalkan bentuk-bentuk ini telah dikembangkan dengan baik dan diperlakukan dengan hati-hati sesuai. Akhirnya, petugas klinis harus menilai sejauh mana mereka membutuhkan pelatihan untuk mengelola dan menafsirkan instrumen. Jika pelatihan lebih lanjut diperlukan, rencana harus dikembangkan untuk memperoleh pelatihan ini.

Standardization
Isu sentral lain yang berkaitan dengan norma kecukupan (lihat Cicchetti, 1994). Setiap tes memiliki norma-norma yang mencerminkan distribusi skor oleh sampel standardisasi. Dasar yang skor tes individu memiliki makna berhubungan langsung dengan kesamaan antara individu yang sedang diuji dan sampel. Jika kesamaan ada antara kelompok atau individu yang diuji dan sampel standarisasi, perbandingan yang memadai dapat dilakukan. Sebagai contoh, jika tes itu standar pada mahasiswa berusia antara 18 dan 22, perbandingan yang berguna dapat dibuat untuk mahasiswa dalam kelompok usia (jika kita menganggap bahwa tes dinyatakan cukup handal dan valid). Orang yang lebih berbeda adalah dari kelompok ini standarisasi (misalnya, lebih dari 70 tahun dengan prestasi pendidikan yang rendah), yang kurang berguna tes ini untuk evaluasi. Pemeriksa mungkin perlu berkonsultasi literatur untuk menentukan apakah penelitian yang mengikuti publikasi manual tes telah dikembangkan norma untuk kelompok yang berbeda. Hal ini terutama
penting untuk tes seperti MMPI dan Rorschach di mana norma-norma untuk populasi yang lebih muda telah diterbitkan. Tiga pertanyaan utama yang berhubungan dengan norma kecukupan harus dijawab. Yang pertama adalah apakah kelompok standardisasi merupakan perwakilan dari populasi yang pemeriksa ingin menggunakan tes. Para pengguna tes harus mencakup informasi yang cukup untuk menentukan keterwakilan sampel standardisasi. Jika informasi ini tidak cukup atau dengan cara apapun tidak lengkap, itu sangat mengurangi tingkat kepercayaan yang dokter dapat menggunakan tes. Praktek ideal dan saat ini adalah untuk menggunakan stratified random sampling. Namun, karena ini bisa menjadi sangat mahal dan prosedur yang memakan waktu, banyak tes yang cukup kekurangan dalam hal ini. Pertanyaan kedua adalah apakah kelompok standardisasi cukup besar. Jika kelompok terlalu kecil, hasilnya tidak dapat memberikan perkiraan stabil karena fluktuasi acak terlalu banyak.
Akhirnya, tes yang baik memiliki norma-norma subkelompok khusus serta norma-norma nasional yang luas. Pengetahuan yang berkaitan dengan norma-norma penguji subkelompok memberikan fleksibilitas yang lebih besar dan keyakinan jika mereka menggunakan tes dengan populasi subkelompok yang sama (lihat Dana, 2000). Hal ini sangat penting ketika subkelompok menghasilkan set nilai yang secara signifikan berbeda dari kelompok standarisasi normal. Subkelompok ini dapat didasarkan pada faktor-faktor seperti etnisitas, jenis kelamin, lokasi geografis, usia, tingkat pendidikan, status sosial ekonomi, atau lingkungan perkotaan dibandingkan di pedesaan. Pengetahuan tentang masing-masing subkelompok norma memungkinkan untuk interpretasi yang lebih tepat dan bermakna nilai.
Standardisasi juga bisa merujuk pada prosedur administrasi. Sebuah tes yang dibangun dengan baik harus memiliki instruksi yang memungkinkan pemeriksa untuk memberikan tes dengan cara yang terstruktur mirip dengan penguji yang lain dan juga untuk mempertahankan standar administrasi antara satu sesi pengujian dan berikutnya. Penelitian telah menunjukkan bahwa memvariasikan instruksi antara satu pemerintahan dan berikutnya dapat mengubah jenis dan kualitas tanggapan ujian membuat, sehingga mengorbankan keandalan tes. Standardisasi administrasi harus mengacu tidak hanya untuk petunjuk, tetapi juga untuk memastikan pencahayaan yang memadai, tenang, tanpa gangguan, dan hubungan baik.

REABILITY
Reability tes mengacu pada derajat stabilitas, prediktabilitas konsistensi, dan
akurasi. Ini alamat sejauh mana skor yang diperoleh oleh seseorang adalah sama jika orang itu ulang dengan tes yang sama pada kesempatan yang berbeda. Mendasari konsep reliabilitas adalah berbagai kemungkinan kesalahan, atau kesalahan pengukuran, dari skor tunggal. Ini adalah perkiraan dari berbagai fluktuasi acak yang mungkin yang dapat diharapkan dalam skor individu. Perlu ditekankan, bagaimanapun, bahwa tingkat kesalahan tertentu atau kebisingan selalu hadir dalam sistem, dari faktor-faktor seperti salah membaca dari item, prosedur administrasi yang buruk, atau mood yang berubah dari klien.

Jika ada tingkat besar fluktuasi acak, pemeriksa tidak dapat menempatkan banyak kepercayaan dalam skor individu. Tujuan dari konstruktor tes adalah untuk mengurangi, sebanyak mungkin, tingkat kesalahan pengukuran, atau fluktuasi acak. Jika ini tercapai, perbedaan antara satu skor dan lain untuk karakteristik yang diukur lebih mungkin merupakan hasil dari beberapa perbedaan tepat dibandingkan fluktuasi dari beberapa kesempatan.

Test-Retest Reliability

Uji reliabilitas tes ulang-ditentukan dengan pemberian tes dan kemudian mengulanginya pada kesempatan kedua. Koefisien reliabilitas dihitung dengan menghubungkan skor yang diperoleh oleh orang yang sama pada dua pemerintahan yang berbeda. Tingkat korelasi antara dua nilai menunjukkan sejauh mana skor tes dapat digeneralisasi dari satu situasi ke yang berikutnya. Jika korelasi tinggi, hasilnya kurang mungkin disebabkan oleh fluktuasi acak dalam kondisi ujian atau lingkungan pengujian. Jadi, ketika tes ini digunakan dalam praktek sebenarnya, pemeriksa dapat relatif yakin bahwa perbedaan dalam skor adalah hasil dari sebuah perubahan yang sebenarnya dalam sifat yang diukur daripada fluktuasi acak.
            Sejumlah faktor harus dipertimbangkan dalam menilai kelayakan test-retest reability. Salah satunya adalah bahwa interval antara administrasi dapat mempengaruhi reability. Dengan demikian, manual tes harus menentukan interval serta setiap perubahan hidup yang signifikan bahwa peserta ujian mungkin mengalami seperti konseling, perubahan karir, atau psikoterapi. Sebagai contoh, tes kecerdasan prasekolah sering memberikan korelasi cukup tinggi apakah pemerintah kedua adalah dalam beberapa bulan yang pertama. Namun, korelasi dengan masa kanak-kanak kemudian atau IQ dewasa umumnya rendah karena tak terhitung intervensi perubahan hidup. Salah satu kesulitan utama dengan tes-tes ulang reability adalah efek bahwa praktek dan memori mungkin memiliki kinerja, yang dapat menghasilkan perbaikan antara satu pemerintahan dan berikutnya. Ini adalah khusus masalah untuk tes dipercepat dan memori seperti yang ditemukan pada Simbol Digit dan Aritmatika subyek dari WAIS-III. Sumber tambahan variasi mungkin hasilnya acak, fluktuasi jangka pendek dalam ujian, atau variasi dalam kondisi pengujian. Secara umum, tes-tes ulang keandalan adalah metode yang disukai hanya jika variabel yang diukur relatif stabil. Jika variabel sangat berubah (misalnya, kecemasan), metode ini biasanya tidak memadai.
Alternate Forms
Metode bentuk-bentuk alternatif menghindari banyak masalah yang dihadapi dengan tes-tes ulang reliabilitas. Logika di balik bentuk-bentuk alternatif adalah bahwa, jika sifat yang diukur beberapa kali pada individu yang sama dengan menggunakan bentuk paralel pengujian, pengukuran yang berbeda harus menghasilkan hasil yang sama. Tingkat kesamaan antara nilai mewakili koefisien reliabilitas tes. Seperti dalam metode pengujian-pengujian ulang, interval antara pemerintah harus selalu dimasukkan dalam manual serta deskripsi dari setiap pengalaman hidup yang signifikan intervensi. Jika kedua pemerintahan ini diberikan segera setelah yang pertama, keandalan yang dihasilkan lebih merupakan ukuran korelasi antara bentuk dan tidak di seluruh kesempatan. Korelasi ditentukan oleh tes diberikan dengan interval lebar, seperti dua bulan atau lebih, memberikan ukuran dari kedua hubungan antara bentuk dan tingkat stabilitas temporal.

Split Half Reliabilitas
Metode setengah split teknik terbaik untuk menentukan keandalan untuk sifat dengan tingkat tinggi fluktuasi. Karena tes ini diberikan hanya sekali, item yang terbelah setengah, dan dua bagian yang berkorelasi. Karena hanya ada satu pemerintahan, tidak mungkin efek waktu untuk campur tangan karena mereka mungkin dengan metode uji-tes ulang.Dengan demikian, metode setengah perpecahan memberikan ukuran konsistensi internal dari item tes daripada stabilitas temporal administrasi yang berbeda dari tes yang sama. untuk menentukan membagi setengah kehandalan, tes ini sering dibagi atas dasar item ganjil dan genap. Metode ini biasanya cukup untuk tes yang paling. Membagi tes ke babak pertama dan babak kedua bisa efektif dalam beberapa kasus, tetapi sering tidak tepat karena efek kumulatif dari  pemanasan, kelelahan, dan kebosanan, yang semuanya dapat menghasilkan yang berbeda tingkat kinerja pada paruh pertama uji dibandingkan dengan kedua. Seperti halnya dengan metode lain untuk memperoleh reliabilitas, metode setengah perpecahan telah keterbatasan. Ketika tes adalah terbelah dua, ada beberapa item yang lebih sedikit pada setiap setengah, yang hasil variabilitas yang lebih luas karena respon individu tidak dapat menstabilkan dengan mudah sekitar rata-rata. Sebagai prinsip umum, semakin lama tes adalah, semakin handal itu karena semakin besar jumlah item, semakin mudah bagi mayoritas item untuk mengkompensasi untuk perubahan kecil dalam menanggapi beberapa item lainnya. Seperti dengan alternatif bentuk metode, perbedaan dalam konten yang mungkin ada antara satu setengah dan lainnya.
VALIDITY
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.
Face Validity adalah validitas yang berhubungan apa yang nampak dalam mengukur sesuatu dan bukan terhadap apa yang seharusnya hendak diukur.
Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-faktor yang yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, dimana validitas ini diperoleh dengan menggunakan teknik analisis faktor.
Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bahwa suatu alat ukur benar-benar mengukur apa yang seharusnya diukur.
Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerja seseorang di masa mendatang.
Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi.
Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai seberapa jauh pengukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional.
Sementara itu, Kerlinger (1990) membagi validitas menjadi tiga yaitu content validity (validitas isi), construct validity (validitas konstruk), dan criterion-related validity (validitas berdasar kriteria).
Tipe validitas sebagaimana disajikan sebelumnya, pada umumnya digolongkan dalam tiga kategori, yaitu content validity (validitas isi), construct validity (validitas konstruk), dan criterion-related validity (validitas berdasar kriteria). 
      1). Validitas Isi
Validitas isi merupakan validitas yang diperhitumgkan melalui pengujian terhadap isi alat ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi ini adalah "sejauhmana item-item dalam suatu alat ukur mencakup keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang bersangkutan?" atau berhubungan dengan representasi dari keseluruhan kawasan. Pengertian "mencakup keseluruhan kawasan isi" tidak saja menunjukkan bahwa alat ukur tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi yang relevan dan tidak keluar dari batasan tujuan ukur.
Walaupun isi atau kandungannya komprehensif tetapi bila suatu alat ukur mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan hal-hal di luar tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat dikatakan memenuhi ciri validitas yang sesungguhnya.
Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat ukur, sebanyak tergantung pada penilaian subjektif individu. Dikarenakan estimasi validitas ini tidak melibatkan komputasi statistik, melainkan hanya dengan analisis rasional maka tidak diharapkan bahwa setiap orang akan sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah tercapai.
Selanjutnya, validitas isi ini terbagi lagi menjadi dua tipe, yaitu face validity (validitas muka) dan logical validity (validitas logis).
Face Validity (Validitas Muka). Validitas muka adalah tipe validitas yang paling rendah signifikasinya karena hanya didasarkan pada penilaian selintas mengenai isi alat ukur. Apabila isi alat ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat dikatakan validitas muka telah terpenuhi.
Dengan alasan kepraktisan, banyak alat ukur yang pemakaiannya terbatas hanya mengandalkan validitas muka. Alat ukur atau instrumen psikologi pada umumnya tidak dapat menggantungkan kualitasnya hanya pada validitas muka. Pada alat ukur psikologis yang fungsi pengukurannya memiliki sifat menentukan, seperti alat ukur untuk seleksi karyawan atau alat ukur pengungkap kepribadian (asesmen), dituntut untuk dapat membuktikan validitasnya yang kuat.
Logical Validity (Validitas Logis). Validitas logis disebut juga sebagai validitas sampling (sampling validity). Validitas tipe ini menunjuk pada sejauhmana isi alat ukur merupakan representasi dari aspek yang hendak diukur.
Untuk memperoleh validitas logis yang tinggi suatu alat ukur harus dirancang sedemikian rupa sehingga benar-benar berisi hanya item yang relevan dan perlu menjadi bagian alat ukur secara keseluruhan. Suatu objek ukur yang hendak diungkap oleh alat ukur hendaknya harus dibatasi lebih dahulu kawasan perilakunya secara seksama dan konkrit. Batasan perilaku yang kurang jelas akan menyebabkan terikatnya item-item yang tidak relevan dan tertinggalnya bagian penting dari objek ukur yang seharusnya masuk sebagai bagian dari alat ukur yang bersangkuatan.
Validitas logis memang sangat penting peranannya dalam penyusunan tes prestasi dan penyusunan skala, yaitu dengan memanfaatkan blue-print atau tabel spesifikasi.
2). Validitas Konstruk
Validitas konstruk adalah tipe validitas yang menunjukkan sejauhmana alat ukur mengungkap suatu trait atau konstruk teoritis yang hendak diukurnya (Allen & Yen, dalam Azwar 1986).Pengujian validitas konstruk merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur.
Walaupun pengujian validitas konstruk biasanya memerlukan teknik analisis statistik yang lebih kompleks daripada teknik yang dipakai pada pengujian validitas empiris lainnya, akan tetapi validitas konstruk tidaklah dinyatakan dalam bentuk koefisien validitas tunggal. Konsep validitas konstruk sangatlah berguna pada alat ukur yang mengukur trait yang tidak memiliki kriteria eksternal.
3). Validitas Berdasar Kriteria
Pendekatan validitas berdasar kriteria menghendaki tersedianya kriteria eksternal yang dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel perilaku yang akan diprediksikan oleh skor alat ukur.
Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi korelasi antara skor alat ukur dengan skor kriteria. Koefisien ini merupakan koefisien validitas bagi alat ukur yang bersangkutan, yaitu rxy, dimana x melambangkan skor alat ukur dan y melambangkan skor kriteria.
Dilihat dari segi waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar kriteria menghasilkan dua macam validitas yaitu validitas prediktif (predictive validity) dan validitas konkuren (concurrent validity).
Validitas Prediktif. Validitas prediktif sangat penting artinya bila alat ukur dimaksudkan untuk berfungsi sebagai prediktor bagi kinerja di masa yang akan datang. Contoh situasi yang menghendaki adanya prediksi kinerja ini antara lain adalah dalam bimbingan karir; seleksi mahasiswa baru, penempatan karyawan, dan semacamnya.
Contohnya adalah sewaktu kita melakukan pengujian validitas alat ukur kemampuan yang digunakan dalam penempatan karyawan. Kriteria yang terbaik antara lain adalah kinerjanya setelah ia betul-betul ditempatkan sebagai karyawan dan melaksanakan tugasnya selama beberapa waktu. Skor kinerja karyawan tersebut dapat diperoleh dari berbagai cara, misalnya menggunakan indeks produktivitas atau rating yang dilakukan oleh atasannya.
Koefisien korelasi antara skor alat ukur dan kriteria merupakan petunjuk mengenai saling hubungan antara skor alat ukur dengan skor kriteria dan merupakan koefisien validitas prediktif. Apabila koefisien ini diperoleh dari sekelompok individu yang merupakan sampel yang representatif, maka alat ukur yang telah teruji validitasnya akan mempunyai fungsi prediksi yang sangat berguna dalam prosedur alat ukur di masa datang.
Prosedur validasi prediktif pada umumnya memerlukan waktu yang lama dan mungkin pula beaya yang tidak sedikit dikarenakan prosedur ini pada dasarnya bukan pekerjaan yang dianggap selesai setelah melakukan sekali tembak, melainkan lebih merupakan kontinuitas dalam proses pengembangan alat ukur. Sebagaimana prosedur validasi yang lain, validasi prediktif pada setiap tahapnya haruslah diikuti oleh usaha peningkatan kualitas item alat ukur dalam bentuk revisi, modifikasi, dan penyusunan item-item baru agar prosedur yang dilakukan itu mempunyai arti yang lebih besar dan bukan sekedar pengujian secara deskriptif saja.
Validitas Konkuren. Apabila skor alat ukur dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka korelasi antara kedua skor termaksud merupakan koefisien validitas konkuren.
Suatu contoh dimana validitas konkuren layak diuji adalah apabila kita menyusun suatu skala kecemasan yang baru. Untuk menguji validitas skala tersebut kita dapat mengunakan skala kecemasan lain yang telah lebih dahulu teruji validitasnya, yaitu dengan alat ukur TMAS (Tylor Manifest Anxiety Scale).
Validitas konkuren merupakan indikasi validitas yang memadai apabila alat ukur tidak digunakan sebagai suatu prediktor dan merupakan validitas yang sangat penting dalam situasi diagnostik. Bila alat ukur dimaksudkan sebagai prediktor maka validitas konkuren tidak cukup memuaskan dan validitas prediktif merupakan keharusan.
Conceptual Validity
Conceptual validity berfokus pada individual dengan keunikan history dan perilakunya. Hal ini berarti mengevaluasi dan mengintegrasi data tes agar kesimpulan clinician membuat pernyataan yang akurat.
Dalam menentukan conceptual validity, penguji memulainya dengan individu. Lalu, mengobservasi, mengumpulkan data, dan membentuk hipotesis. Jika hipotesis diterima sesuai dengan test data, observasi perilaku, history, penambahan sumber data, hipotesis dapat dianggap valid atau sesuai.
Pengukuran validitas sebenarnya dilakukan untuk mengetahui seberapa besar (dalam arti kuantitatif) suatu aspek psikologis terdapat dalam diri seseorang, yang dinyatakan oleh skor pada instrumen pengukur yang bersangkutan.
Dalam hal pengukuran ilmu sosial, validitas yang ideal tidaklah mudah untuk dapat dicapai. Pengukuran aspek-aspek psikologis dan sosial mengandung lebih banyak sumber kesalahan (error) daripada pengukuran aspek fisik. Kita tidak pernah dapat yakin bahwa validitas instrinsik telah terpenuhi dikarenakan kita tidak dapat membuktikannya secara empiris dengan langsung.
Pengertian validitas alat ukur tidaklah berlaku umum untuk semua tujuan ukur. Suatu alat ukur menghasilkan ukuran yang valid hanya bagi satu tujuan ukur tertentu saja. Tidak ada alat ukur yang dapat menghasilkan ukuran yang valid bagi berbagai tujuan ukur. Oleh karena itu, pernyataan seperti "alat ukur ini valid" belumlah lengkap apabila tidak diikuti oleh keterangan yang menunjukkan kepada tujuannya, yaitu valid untuk apa dan valid bagi siapa. Itulah yang ditekankan oleh Cronbach (dalam Azwar 1986) bahwa dalam proses validasi sebenarnya kita tidak bertujuan untuk melakukan validasi alat ukur akan tetapi melakukan validasi terhadap interpretasi data yang diperoleh oleh prosedur tertentu.
Dengan demikian, walaupun kita terbiasa melekatkan predikat valid bagi suatu alat ukur akan tetapi hendaklah selalu kita pahami bahwa sebenarnya validitas menyangkut masalah hasil ukur bukan masalah alat ukurnya sendiri. Sebutan validitas alat ukur hendaklah diartikan sebagi validitas hasil pengukuran yang diperoleh oleh alat ukur tersebut.
. CLINICAL JUDGMENT
Clinical judgment merupakan contoh dari persepsi dimana clinician mencoba untuk menggunakan sumber apapun yang memungkinkan untuk membuat deskripsi tentang klien menjadi lebih akurat. Sumber ini dapat berupa test data, case history, medical records, dan observasi verbal atau nonverbal mengenai perilaku.
Data Gathering and Synthesis
Ada beberapa isu dan masalah yang berhubungan dengan clinical judgment selama wawancara ada keterlibatan pada pengumpulan dan memadukan data. Salah satu nya, pada hubungan yang meningkatkan kemungkinan bahwa klien akan memberikan performance maksimalnya. Jika hubungan tidak berkembang, hal ini dapat meningkatkan data yang diperoleh dari orang tersebut adalah ketidakakuratan.
            Isu lain yaitu pada wawancara yang dituntun oleh respon klien dan reaksi clinician pada respon tersebut.respon klien bisa saja tidak presentatif karena ada factor lain missal hari yang buruk ataupun tidur yang kurang nyenyak. Respon klien harus diinterpretasikan oleh clinician.
Accuracy of Clinical Judgment
Setelah mengumpulkan dan mengorganisir data, clinician harus membuat final judgment dengan tetap menghormati klien. Menentukan akurasi dari judgment itu penting. Dalam beberapa kejadian, clinical judgment menjadi error, dimana menjadikannya tidak akurat. Untuk meningkatkan akurasi, clinician harus mengetahui bagaimana error itu dapat muncul, bagaimana memperbaiki error itu, dan berguna untuk pelatihan.
Materi sebelumnya menunjukkan bahwa kesalahan dalam penilaian klinis dapat dan memang terjadi. Dengan demikian penting, terutama saat tampil sebagai saksi ahli, bahwa dokter menjadi akrab dengan literatur yang relevan pada penilaian klinis dan, berdasarkan informasi ini, mengambil langkah-langkah untuk meningkatkan akurasi mereka. Oleh karena itu, Garb (1994a, 1998b) dan Pernikahan dan Faust (1989) telah membuat rekomendasi berikut:

1. Untuk menghindari kehilangan informasi penting, dokter harus menggunakan komprehensif, terstruktur, atau semiterstruktur pendekatan setidaknya untuk wawancara. Hal ini terutama penting dalam kasus dimana keputusan klinis yang mendesak (bahaya bagi diri sendiri atau orang lain) mungkin perlu terjadi.
2. Dokter seharusnya tidak hanya mempertimbangkan data yang mendukung hipotesis mereka, tetapi juga hati-hati mempertimbangkan atau bahkan daftar bukti yang tidak mendukung hipotesis mereka.  Hal ini kemungkinan akan mengurangi kemungkinan dari belakang dan bias konfirmasi.
3. Diagnosa harus didasarkan pada perhatian terhadap kriteria khusus yang terkandung
dalam DSM-IV-TR (2000; atau Klasifikasi Internasional Gangguan [ICD-10]). Dalam
khususnya, ini berarti tidak membuat kesalahan yang disebabkan oleh kesimpulan bias berdasarkan jenis kelamin dan etnis.
4. Karena memori dapat menjadi subjek proses rekonstruksi dengan kemungkinan, kesalahan dokter harus menghindari mengandalkan pada memori dan, lebih, lihat catatan hati sebanyak
mungkin.  
5. Dalam membuat prediksi, dokter harus memperhatikan tingkat dasar sebanyak mungkin.
Seperti pertimbangan berpotensi menyediakan perkiraan kasar dari seberapa sering perilaku
akan terjadi pada populasi tertentu atau konteks. Setiap prediksi klinis, kemudian, adalah
dipandu oleh terjadinya tingkat dasar dan kemungkinan akan perbaikan pada tingkat dasar.  
6. Dokter harus mencari umpan balik bila mungkin mengenai akurasi dan kegunaan
penilaian mereka. Sebagai contoh, laporan psikologis idealnya harus diikuti dengan bentuk rating (yang dapat diselesaikan oleh sumber rujukan) yang berkaitan dengan kejelasan, presisi, akurasi, dan kegunaan dari informasi dan rekomendasi terkandung dalam laporan (lihat Ownby & Wallbrown, 1983).  
7. Dokter harus belajar sebanyak mungkin mengenai teoritis dan empiris relevan dengan orang atau kelompok mereka menilai materi. Hal ini berpotensi akan membantu mengembangkan strategi untuk memperoleh informasi yang komprehensif, memungkinkan dokter untuk membuat perkiraan yang benar mengenai akurasi penilaian mereka, dan memberi mereka dengan informasi tarif dasar yang tepat.
8. Keakraban dengan literatur tentang penilaian klinis harus digunakan untuk terus-menerus
Update praktisi di masa lalu dan muncul tren.
Kadang-kadang dalam proses pengadilan, psikolog ditantang tentang kesulitan terkait dengan penilaian klinis. Jika langkah-langkah sebelumnya diambil, psikolog dapat dibenarkan menjawab bahwa mereka akrab dengan literatur dan telah mengambil yang sesuai langkah-langkah untuk menjaga terhadap kesalahan dalam penilaian klinis. Lebih penting lagi, kualitas jasa yang berhubungan dengan klien dan sumber-sumber rujukan juga kemungkinan akan ditingkatkan.

Clinical versus Actuarial Prediction
Hampir 50 tahun yang lalu, Meehl (1954) menerbitkan sebuah review penelitian membandingkan relatif akurasi penilaian klinis untuk rumus statistik ketika digunakan pada set identik data (kehidupan sejarah, data demografi, profil tes). Pendekatan klinis yang digunakan dokter  penilaian, sedangkan pendekatan yang digunakan aktuaris secara empiris rumus turunan, seperti celana tunggal / ganda dan persamaan regresi, untuk datang ke keputusan tentang klien. Tinjauannya meliputi sejumlah besar pengaturan termasuk penempatan militer, kuliah sukses, residivisme kriminal, dan manfaat dari psikoterapi. Dia menyimpulkan bahwa keputusan statistik secara konsisten mengungguli penilaian klinis (Meehl, 1954, 1965). Hal ini mengakibatkan beberapa perdebatan ramai di jurnal, dengan Meehl s kesimpulan umumnya yang didukung (Garb, 1994b; Grove, Zald, Lebow, Snitz, & Nelson, 2000; Kleinmuntz, 1990). Dawes dan Corrigan (1974) bahkan menemukan bahwa aktuaria rumus berdasarkan dokter sendiri yang spesifik 'proses pengambilan keputusan menghasilkan prediksi masa depan yang lebih valid dari prediksi dokter sendiri '. Ini mungkin karena rumus mengurangi pengaruh kesalahan yang tidak terkontrol di dokter ' prosedur.
Meskipun dukungan empiris untuk pendekatan aktuaria, beberapa praktis dan teoritis isu-isu perlu dipertimbangkan. Sebuah pendekatan klinis untuk mengintegrasikan data dan tiba pada kesimpulan yang memungkinkan seorang dokter untuk mengeksplorasi, menyelidiki, dan memperdalam pemahaman nya di banyak daerah. Ini sering melibatkan daerah yang tes atau formula statistik tidak dapat mengukur. Seringkali wawancara adalah satu-satunya cara untuk memperoleh pengamatan perilaku dan aspek unik dari sejarah. Kejadian aneh dengan frekuensi rendah kejadian secara signifikan dapat mengubah suatu kesimpulan klinisi meskipun tidak ada formula mengambil peristiwa ini ke rekening. Hal ini sangat umum untuk yang unik, peristiwa langka telah terjadi di beberapa waktu di kehidupan klien, dan, selama proses penilaian, mereka sering relevan dan sering dapat mengubah kesimpulan dari banyak, jika tidak sebagian, penilaian klinis. Tidak hanya unik aspek dari interpretasi orang yang berubah, tetapi biasanya penilaian bagi seseorang perlu difokuskan untuk konteks tertentu dan situasi tertentu yang dia terlibat masuk Ketika perubahan fokus dari kelembagaan untuk pengambilan keputusan individu, relevansi aturan statistik menjadi kurang praktis (McGrath, 2001; Vane & Guarnaccia,1989). Tidak hanya individu terlalu beragam, tetapi juga situasi unik mereka, konteks, dan keputusan-keputusan yang mereka hadapi bahkan lebih beragam.
Kesulitan lebih lanjut dengan pendekatan murni aktuarial adalah bahwa pengembangan tes kedua reliabilitas dan validitas, serta formula aktuaria. Untuk pendekatan tersebut akan berguna, asumsi implisit adalah bahwa baik masyarakat, maupun mengubah kriteria. Sebaliknya, praktisi harus berurusan dengan alami dunia yang tidak sempurna, terus berubah, tidak selalu mengikuti aturan, diisi dengan terus berubah persepsi, dan tunduk pada kesempatan atau setidaknya mustahil-topredict peristiwa. Jadi, bahkan ketika rumus statistik yang tersedia, mereka mungkin tidak berlaku. Pembedaan antara orientasi statistik psychometrician dan alami lingkungan dari praktisi mendasari perbedaan antara kedua dunia (Beutler, 2000). Praktisi entah bagaimana harus mencoba untuk menggabungkan dua mode analisis, tapi sering menemukan tugas sulit. Mungkin benar bahwa studi terkontrol pada umumnya mendukung pendekatan statistik selama satu klinis tetapi, pada saat yang sama, kebenaran yang jarang berguna untuk praktisi terlibat dalam dunia yang terus berubah dan unik praktek
(Bonarius, 1984). Seringkali, tidak ada alternatif lain selain mengandalkan penilaian klinis untuk menggabungkan berbagai informasi yang relevan. Hal ini kembali ke perspektif pra-Meehl adalah malang dan diterima oleh kebanyakan dokter dengan ragu-ragu. Bonarius (1984) menyajikan alternatif konseptual untuk dilema ini. Langkah pertama adalah untuk mengubah pandangan mekanistik dari prediksi. Sebaliknya, dokter mungkin menghindari istilah prediksi sama sekali dan menggunakan antisipasi. Mengantisipasi kemungkinan di masa depan menyiratkan Proses konstruksi kognitif daripada proses mekanis. Ini mengakui bahwa dunia tidak pernah dapat sempurna dalam arti mekanistik dan bahwa tidak ada hal seperti rata-rata orang dalam situasi rata-rata terlibat dalam interaksi rata-rata. Selanjutnya, penciptaan kejadian masa depan bersama oleh coparticipants. Klien mengambil yang aktif bagian dalam merumuskan dan mengevaluasi tujuan mereka. Keberhasilan tujuan masa depan tergantung pada tingkat usaha mereka bersedia untuk dimasukkan ke dalamnya. Tanggung jawab berbagi coparticipants untuk masa depan. Dengan demikian, kemungkinan bahwa peristiwa di masa depan akan terjadi adalah terkait untuk kedua konstruksi kognitif dari dunia aneh dan interaksi antara peserta.
Idealnya, dokter perlu menyadari dan untuk digunakan, bila tersedia, pendekatan aktuaria seperti beberapa celana dan persamaan regresi. Masa Depan dibantu komputer analisis hasil penilaian dapat memberikan prediksi semakin aktuaria terutama dari berbagai sumber (yaitu, Garb, 2000; Groth-Marnat, 2000b). Kesimpulan yang dicapai dari pendekatan aktuaria juga perlu diintegrasikan dengan data dan kesimpulan didapat hanya melalui sarana klinis. Jika rincian yang tidak biasa tentang klien ditemukan dan hasil dalam mengubah penafsiran, dasar untuk perubahan ini harus dicatat dalam psikologis laporan. Dokter juga harus peka terhadap perbedaan individu secara pribadi akurasi persepsi antara satu praktisi dan berikutnya. Perbedaan-perbedaan ini mungkin tergantung pada pengalaman, pelatihan, pengetahuan, kepribadian, dan jumlah dan kualitas umpan balik mengenai persepsi dokter yang berbeda. Selain itu, dokter harus mengakui kemungkinan kenaikan dan penurunan dalam penafsiran tes dan klinis penilaian yang dihasilkan dari penambahan validitas instrumen mereka karena lebih informasi tidak selalu meningkatkan akurasi prediksi berbasis klinis (Garb, 1994b, 1998b; Kleinmuntz, 1990). Meskipun tidak mungkin bahwa aturan-aturan prediksi aktuaria akan menggantikan penilaian klinis, aturan prediksi formal dapat dan harus digunakan lebih luas sebagai sumber daya untuk meningkatkan akurasi pengambilan keputusan klinis.

Psychological Report
Sebuah laporan psikologis yang akurat dan efektif mensyaratkan bahwa dokter mengklarifikasi mereka berpikir dan mengkristal interpretasi mereka. Laporan ikatan bersama semua sumber informasi, seringkali menggabungkan isu antarprofesi dan interpersonal yang kompleks. Semua keunggulan dan keterbatasan yang terlibat dengan penilaian klinis baik secara langsung atau tidak langsung mempengaruhi laporan. Harus fokus komunikasi yang jelas dari interpretasi klinisi, kesimpulan, dan rekomendasi. Bab 15 menyediakan informasi mendalam mengenai laporan psikologis yang berkaitan dengan penelitian yang relevan, pedoman, format, dan sampel laporan.

PHASES IN CLINICAL ASSESSMENT
Garis besar tahapan penilaian klinis dapat menyediakan baik kerangka konseptual untuk mendekati evaluasi dan ringkasan dari beberapa poin yang sudah dibahas. Meskipun langkah-langkah dalam penilaian terisolasi untuk kenyamanan konseptual, di kenyataannya, mereka sering terjadi bersamaan dan berinteraksi dengan satu sama lain. Seluruh fase ini, dokter harus mengintegrasikan data dan melayani sebagai seorang ahli pada perilaku manusia bukan hanya penafsir skor tes. Hal ini konsisten dengan keyakinan bahwa penilaian psikologis dapat paling berguna ketika alamat individu tertentu masalah dan menyediakan pedoman untuk pengambilan keputusan tentang masalah ini.

Evaluating the Referral Question
Banyak keterbatasan praktis hasil evaluasi psikologis dari memadai klarifikasi masalah. Karena dokter menyadari aset dan keterbatasan tes psikologis, dan karena dokter bertanggung jawab untuk menyediakan informasi yang berguna, itu adalah tugas mereka untuk mengklarifikasi permintaan yang mereka terima. Selanjutnya, mereka tidak dapat mengasumsikan bahwa permintaan awal untuk evaluasi secara memadai dinyatakan. Dokter mungkin perlu untuk mengungkap agenda tersembunyi, harapan tak terucapkan, dan interpersonal yang kompleks hubungan, serta menjelaskan keterbatasan tertentu psikologis tes. Salah satu persyaratan umum yang paling penting adalah bahwa dokter memahami kosakata model, konseptual, dinamika, dan harapan pengaturan rujukan di yang mereka akan bekerja (Turner et al., 2001).
Dokter jarang diminta untuk memberikan penilaian umum atau global, tetapi malahan diminta untuk menjawab pertanyaan spesifik. Untuk menjawab pertanyaan ini, kadang-kadang membantu untuk menghubungi sumber rujukan pada berbagai tahap dalam proses penilaian. Sebagai contoh, sering penting dalam evaluasi pendidikan untuk mengamati siswa dalam kelas lingkungan. Informasi yang diperoleh dari observasi seperti mungkin disampaikan kembali ke sumber rujukan untuk penjelasan lebih lanjut atau modifikasi dari pertanyaan rujukan. Demikian juga, seorang pengacara mungkin ingin mengubah pertanyaan agak rujukannya berdasarkan awal informasi yang diperoleh dari wawancara awal klinisi dengan klien.

Acquiring Knowledge Relating to the
Content of the Problem
Sebelum memulai prosedur pengujian yang sebenarnya, pemeriksa harus hati-hati mempertimbangkan masalah, kecukupan tes mereka akan menggunakan, dan penerapan spesifik dari yang tes untuk situasi unik individu. Persiapan ini mungkin memerlukan mengacu baik untuk tes manual dan sumber-sumber luar tambahan. Dokter harus akrab dengan operasional definisi untuk masalah seperti gangguan kecemasan, psikosis, gangguan kepribadian, atau gangguan organik sehingga mereka dapat waspada terhadap ekspresi yang mungkin mereka selama prosedur penilaian. Kompetensi dalam administrasi dan skor hanya tes tidak cukup untuk melakukan penilaian yang efektif. Sebagai contoh, pengembangan Nilai IQ tidak selalu menunjukkan bahwa pemeriksa menyadari ekspresi budaya yang berbeda kecerdasan atau keterbatasan dari perangkat penilaian. Hal ini penting bahwa dokter memiliki pengetahuan yang mendalam tentang variabel mereka mengukur atau mereka evaluasi kemungkinan akan sangat terbatas.
Terkait dengan ini adalah kecukupan relatif tes dalam mengukur variabel yang dipertimbangkan. Ini termasuk mengevaluasi pertimbangan praktis tertentu, standardisasi sampel, dan kehandalan dan validitas. Adalah penting bahwa pemeriksa juga mempertimbangkan masalah dalam kaitannya dengan kecukupan tes dan memutuskan apakah tes tertentu atau tes dapat tepat digunakan pada individu atau kelompok. Hal ini menuntut pengetahuan di bidang seperti usia klien, jenis kelamin, etnis, ras, pendidikan latar belakang, motivasi untuk pengujian, tingkat diantisipasi perlawanan, lingkungan sosial, dan interpersonal hubungan. Akhirnya, dokter perlu untuk menilai efektivitas atau kegunaan tes dalam membantu proses pengobatan.

Data Collection ( Pengumpulan Data )
Setelah mengklarifikasi pertanyaan rujukan dan memperoleh pengetahuan yang berkaitan dengan masalah, dokter kemudian dapat melanjutkan dengan pengumpulan informasi aktual. Ini mungkin datang dari berbagai sumber, yang paling sering yang skor tes, sejarah pribadi,  perilaku pengamatan, dan data wawancara. Dokter juga dapat menemukan itu yang berguna untuk memperoleh catatan sekolah, pengamatan psikologis sebelumnya, catatan medis, laporan polisi, atau membahas klien dengan orang tua atau guru. Hal yang penting untuk menyadari bahwa tes ini hanyalah alat tunggal, atau sumber, untuk memperoleh data. Sejarah kasus sama pentingnya karena memberikan konteks untuk memahami klien saat ini masalah dan, melalui pemahaman ini, membuat skor tes bermakna. Dalam banyak kasus, sejarah klien adalah sangat penting bahkan lebih dalam membuat prediksi dan menilai keseriusan kondisi nya daripada  skor tes nya. Sebagai contoh, skor tinggi pada depresi pada MMPI-2 adalah tidak bermanfaat dalam menilai risiko bunuh diri sebagai faktor sejarah seperti jumlah usaha sebelumnya, usia, jenis kelamin, rincian tentang setiap upaya sebelumnya, dan lamanya waktu klien telah tertekan. Hal yang sama penting adalah bahwa nilai tes itu sendiri biasanya tidak cukup untuk menjawab referal pertanyaan. Untuk memecahkan masalah tertentu dan pengambilan keputusan, dokter harus mengandalkan berbagai sumber dan, dengan menggunakan sumber-sumber, periksa untuk menilai konsistensi dari pengamatan mereka buat.
KamusBottom of FoKamus
Bottom of Form
Interpreting the Data
Hasil akhir dari penilaian tentang klien harus memperhatikan hal-hal yang berkaitan dengan etiologi, prognosis, dan rekomendasi pengobatan. Selanjutnya mungkin elaborasi juga mencoba untuk menilai orang tersebut dari perspektif sistem di mana dokter  mengevaluasi pola interaksi, dan spesifikasi dari lingkaran informasi umpan balik. Suatu tambahan penting adalah dengan menggunakan data untuk mengembangkan suatu Rencana yang efektif untuk intervensi (lihat Beutler & Clarkin, 1990; Beutler, Clarkin, & Bongar, 2000; Jongsma & Peterson, 1995). Dokter juga harus memperhatikan dengan hati-hati penelitian, dan implikasi dari validitas tambahan dan terus menjadi sadar keterbatasan dan ketidakakuratan mungkin terlibat dalam penilaian klinis. Pertimbangan ini menunjukkan bahwa deskripsi klien tidak harus menjadi pelabelan belaka atau klasifikasi, namun harus lebih memberikan pemahaman yang lebih dalam dan lebih akurat dari orang tersebut. Selanjutnya dokter harus membuat kesimpulan dari data uji mereka.
Meskipun data tersebut obyektif dan empiris, proses pengembangan hipotesis, memperoleh dukungan untuk hipotesis, dan mengintegrasikan kesimpulan tergantung pada pengalaman dan pelatihan dokter. Proses ini umumnya diikuti dengan mengidentifikasi fakta yang relevan, membuat kesimpulan, dan mendukung kesimpulan tersebut dengan data yang relevan dan konsisten. Maloney dan Ward (1976)telah membuat konsep pendekatan tujuh fase (Gambar 1.1) untuk mengevaluasi data. Mereka mencatat bahwa, fase-fase tersebut mungkin saja terjadi secara bersamaan. Sebagai contoh, ketika dokter membaca pertanyaan rujukan atau awalnya mengamati klien, ia telah mengembangkan hipotesis tentang orang itu dan memeriksa untuk menilai validitas pengamatan ini.
Tahap 1
Tahap pertama melibatkan pengumpulan data tentang klien. Ini dimulai dengan rujukan pertanyaan dan diikuti dengan review sejarah sebelumnya klien dan catatan. Pada titik ini, klinisi sudah mulai mengembangkan hipotesis tentatif dan untuk memperjelas pertanyaan untuk penyelidikan lebih terinci. Langkah selanjutnya adalah menghubungi klien, yang kemudian dokter melakukan wawancara dan mengelola berbagai tes psikologis. Perilaku klien selama wawancara, serta data atau faktual,dicatat. Dari data ini, dokter mulai membuat kesimpulannya.
Tahap 2
Tahap 2 berfokus pada pengembangan berbagai kesimpulan tentang klien. Kesimpulan ini berisikan ringkasan yang jelas. Sebagai contoh, pemeriksa dapat menyimpulkan bahwa klien adalah depresi, yang juga dapat menjelaskan memperlambat nya kinerja, perilaku penarikan diri. Pemeriksa maka mungkin ingin mengevaluasi apakah depresi ini sifat mendarah daging atau hanya reaksi terhadap kesulitan situasional saat ini. Ini dapat ditentukan dengan menguji nilai, data wawancara, atau sumber informasi tambahan yang tersedia. Penekanan dalam tahap kedua pada pengembangan beberapa kesimpulan yang awalnya harus bersifat tentatif. Hal ini bertujuan membimbing penyelidikan masa depan untuk memperoleh tambahan informasi yang kemudian digunakan untuk mengkonfirmasi, memodifikasi, atau meniadakan hipotesis.
Tahap 3
Karena fase ketiga yang bersangkutan dengan baik menerima atau menolak kesimpulan dikembangkan di Tahap 2, ada interaksi konstan dan aktif antara fase ini. Seringkali dalam menyelidiki validitas kesimpulan, seorang dokter mengubah baik makna atau penekanan inferensi, atau mengembangkan yang baru seluruhnya. Jarang inferensi sepenuhnya dibuktikan, melainkan validitas kesimpulan bahwa secara progresif diperkuat oleh dokter dengan mengevaluasi tingkat konsistensi dan kekuatandata yang mendukung suatu kesimpulan tertentu. Sebagai contoh, kesimpulan bahwa klien cemas mungkin tidak didukung oleh WAIS-III subskala kinerja, score MMPI-2 , dan pengamatan perilaku atau hanya dapat disarankan oleh salah satu sumber tersebut. Jumlah bukti untuk mendukung kesimpulan secara langsung mempengaruhi jumlah kepercayaan dokter dapat menempatkan dalam inferensi ini.
Tahap 4
Sebagai hasil dari kesimpulan yang dikembangkan dalam tiga tahap sebelumnya, klinisi bisa bergerak pada Tahap 4 dari kesimpulan spesifik untuk pernyataan umum tentang klien. Ini melibatkan elaborasi setiap inferensi untuk menggambarkan tren atau pola klien. Sebagai contoh,kesimpulan bahwa klien depresi mungkin akibat dari self-verbalizations di mana klien terus mengkritik dan menghakimi perilakunya. Tugas sentral dalam Tahap 4 adalah mengembangkan dan mulai mengerjakan dengan teliti laporan atau pernyataan yang berkaitan dengan klien.
Tahap 5, 6, 7
Tahap kelima melibatkan penjelasan lebih lanjut dari berbagai ciri-ciri kepribadian individu. Ini merupakan integrasi dan korelasi karakteristik klien. Ini mungkin termasuk menjelaskan dan mendiskusikan faktor-faktor umum seperti kognitif, suasana hati, dan tingkat interpersonal-intrapersona. Meskipun Fase 4 dan 5 adalah sama, Fase 5 menyediakan lebih komprehensif dan terintegrasi deskripsi klien dari Fase 4. Akhirnya, Fase 6 ini adalah tempat komprehensif uraian tentang orang ke dalam konteks situasional dan Tahap 7 membuat prediksi yang spesifik berkenaan dengan perilaku nya. Tahap 7 adalah elemen yang paling penting yang terlibat dalam membuat keputusan dan mengharuskan dokter memperhitungkan interaksi antara pribadi dan variabel situasional. Menetapkan validitas kesimpulan ini menyajikan sebuah tantangan yang sulit bagi dokter karena, tidak seperti diagnosa medis, psikologis kesimpulan tidak bisa biasanya secara fisik didokumentasikan. Selanjutnya, dokter jarang dihadapkan dengan umpan balik tentang keabsahan kesimpulan. Meskipun kesulitan-kesulitan ini, deskripsi psikologis harus berusaha untuk dapat diandalkan, memiliki  deskriptif yang cukup luas dan memiliki baik validitas deskriptif dan prediktif. Keandalan deskripsi mengacu pada apakah penjelasan atau klasifikasi dapat ditiru oleh dokter lain (Perjanjian interdiagnostician) serta oleh dokter yang sama pada kesempatan yang berbeda (perjanjian intradiagnostician). Kriteria berikutnya adalah luasnya cakupan yang dicakup dalam klasifikasi. Klasifikasi apapun harus cukup luas untuk mencakup berbagai individu, namun cukup spesifik untuk memberikan informasi yang berguna tentang individu yang dievaluasi. Sebagai contoh, apakah individu-individu dengan profil MMPI-2 yang sama juga sama pada atribut yang relevan lainnya seperti sejarah keluarga, variabel demografi, kesulitan hukum, atau penyalahgunaan alkohol? Akhirnya, validitas prediktif mengacu pada kepercayaan dengan kesimpulan uji yang dapat digunakan untuk mengevaluasi hasil masa depan. Ini mungkin termasuk prestasi akademik, kinerja pekerjaan, atau hasil dari pengobatan. Ini adalah salah satu fungsi yang paling penting dari pengujian. Kecuali kesimpulan dapat dibuat yang secara efektif meningkatkan pengambilan keputusan, cakupan dan relevansi pengujian berkurang secara signifikan. Meskipun kriteria ini sulit untuk mencapai dan untuk mengevaluasi, mereka mewakili standar ideal yang penilaian harus berusaha.
 Daftar Pustaka
Groth-Marnat, Gary. Handbook of psychological assessment / Gary Groth-Marnat.—4th ed.