Sebelum guru menggunakan suatu tes, hendaknya guru mengukur terlebih dahulu derajat validitasnya berdasarkan kriteria tertentu. Dengan kata lain, untuk melihat apakah tes tersebut valid (sahih), kita harus membandingkan skor peserta didik yang didapat dalam tes dengan skor yang dianggap sebagai nilai baku. 
A. Konsep Dasar Validitas
Menurut Arikunto (1999: 65), validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes. Suatu tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Tes memiliki validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam arti memiliki kesejajaran antara tes dan kriteria (Arikunto, 2019). 
Sebelum guru menggunakan suatu tes, hendaknya guru mengukur terlebih dahulu derajat validitasnya berdasarkan kriteria tertentu. Dengan kata lain, untuk melihat apakah tes tersebut valid (sahih), kita harus membandingkan skor peserta didik yang didapat dalam tes dengan skor yang dianggap sebagai nilai baku. Misalnya, nilai ujian akhir semester peserta didik dalam salah satu mata pelajaran dibandingkan dengan nilai akhir semester pada mata pelajaran yang lain. Makin mendekati kedua skor tersebut, maka semakin soal ujian akhir tadi dapat dikatakan valid. Validitas suatu tes erat kaitannya dengan tujuan penggunaan tes tersebut. Namun, tidak ada validitas yang berlaku umum. Artinya, jika suatu tes dapat memberikan informasi yang sesuai dan dapat digunakan untuk mencapai tujuan tertentu, maka tes itu valid untuk tujuan tersebut. 
Ada dua unsur penting dalam validitas ini. Pertama, validitas menunjukkan suatu derajat, ada yang sempurna, ada yang sedang, dan ada pula yang rendah. Kedua,  validitas selalu dihubungkan dengan suatu keputusan atau tujuan yang spesifik. Sebagaimana pendapat R.L. Thorndike dan H.P. Hagen (1997) bahwa “Validity is always in relation to a specific decision or use,” (Messick, 1987). 
Sementara itu, Gronlund (1985) mengemukakan ada tiga faktor yang memengaruhi validitas hasil tes, yaitu “faktor instrumen evaluasi, faktor administrasi evaluasi dan penskoran, dan faktor dari jawaban peserta didik”. Selanjutnya, Kerlinger (1986) mengemukakan, “validitas instrumen tidak cukup ditentukan oleh derajat ketepatan instrumen untuk mengukur apa yang seharusnya diukur, tetapi perlu juga dilihat dari kriteria yang lain, yaitu appropriateness, meaningfulness, dan usefulness (Osadebe: 2015).
B. Cara Menentukan Validitas
Untuk menguji validitas setiap butir soal maka skor-skor yang ada pada butir yang dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir soal dinyatakan dengan skor X dan skor total dinyatakan sebagai skor Y, dengan diperolehnya indeks validitas setiap butir soal, dapat diketahui butir-butir soal manakah yang memenuhi syarat dilihat dari indeks validitasnya. Untuk menguji validitas instrumen dapat menggunakan rumus korelasi product moment dengan angka kasar, yaitu: 
 Dari rumus di atas, didapatkan bahwa rxy merupakan koefisien korelasi antara variabel X dan variabel Y, N merupakan jumlah siswa uji coba, X adalah skor-skor tiap butir soal. Untuk menginterpretasikan tingkat validitas, Arikunto (1991) mengategorikan koefisien korelasi pada kriteria sebagai berikut: 
 
      
| Nilai r | Interpretasi | 
| 0,81–1,00 | Sangat Tinggi | 
| 0,61–0,80 | Tinggi | 
| 0,41–0,60 | Cukup | 
| 0,21–0,40 | Rendah | 
| 0,00–0,20 | Sangat Rendah | 
 
Setelah harga koefisien validitas tiap butir soal diperoleh, perlu dilakukan uji signifikansi untuk mengukur keberartian koefisien korelasi berdasarkan distribusi kurva normal dengan menggunakan statistik uji-t dengan persamaan:
Nilai t merupakan nilai hitung koefisien validitas, rxy adalah nilai koefisien korelasi tiap butir soal, dan N adalah jumlah siswa uji coba. Kemudian hasil di atas dibandingkan dengan nilai t dari tabel pada taraf kepercayaan 95% dan derajat kebebasan (dk) = N–2. Jika thitung > ttabel maka koefisien validitas butir soal pada taraf signifikansi yang dipakai.
C. Jenis-Jenis Validitas
Dalam literatur modern tentang evaluasi, banyak dikemukakan tentang jenis-jenis validitas, antara lain validitas permukaan (face validity), validitas isi (content validity), validitas empiris (empirical validity), dan validitas konstruk (construct validity), serta validitas faktor (factorial validity).
1. Validitas Permukaan
Validitas ini menggunakan kriteria yang sangat sederhana, karena hanya melihat sisi muka atau tampang dari instrumen itu sendiri. Artinya, jika suatu tes secara sepintas telah dianggap baik untuk mengungkap fenomena yang akan diukur, maka tes tersebut sudah dapat dikatakan memenuhi syarat validitas permukaan, sehingga tidak perlu lagi adanya penilaian yang mendalam.
2. Validitas Isi 
Validitas isi menunjukkan sejauh mana pertanyaan, tugas atau butir dalam suatu tes atau instrumen mampu mewakili secara keseluruhan dan proporsional perilaku sampel yang dikenai tes tersebut. Validitas isi mengukur derajat kemampuan tes dalam mengukur cakupan substansi elemen yang ingin diukur. Validitas isi digunakan untuk mengukur kemampuan belajar, hasil belajar atau prestasi belajar.
3. Validitas Empiri 
Validitas empiris atau validitas kriteria ditentukan berdasarkan kriteria, baik kriteria internal maupun kriteria eksternal. Validitas kriteria diperoleh melalui hasil uji coba tes kepada responden yang setara dengan responden yang akan dievaluasi atau diteliti. Contoh penggunaan validitas kriteria adalah tes inteligensi yang berkorelasi dengan rata-rata nilai akademis. Asumsinya, jika inteligensi seseorang tinggi maka yang terjadi adalah dia akan mendapatkan nilai akademis yang bagus (Arikunto, 2016)
Validitas konstruk adalah validitas yang mempermasalahkan seberapa jauh butir-butir tes mampu mengukur apa yang benar-benar hendak diukur sesuai dengan konsep khusus atau definisi konseptual yang telah ditetapkan. Menurut Kusaeri (2012), validitas konstruk (construct) berkaitan dengan fenomena dan objek yang abstrak, tetapi gejalanya dapat diamati dan dapat diukur.
5. Validitas Faktor
Dalam penilaian hasil belajar, sering digunakan skala pengukuran tentang suatu variabel yang terdiri atas beberapa faktor. Faktor-faktor tersebut diperoleh berdasarkan dimensi/indikator dari variabel yang diukur sesuai dengan apa yang terungkap dalam konstruksi teoritisnya. Salah satunya dengan cara menghitung homogenitas skor yang ada.
D. Daftar Referensi
- Azwar. (1987). Metodologi Penelitian. Jakarta: Binarupa Aksara.
- Arikunto, S. (2016). Dasar-Dasar Evaluasi Pendidikan.
- ______(2019). Prosedur Penelitian suatu Pendekatan Praktik.
- Messick, S. (1987). Validity. ETS Research Report Series, 1987(2), i-208.
- Osadebe, P. U. (2015). Construction of Valid and Reliable Test for Assessment of Students. Journal of Education and Practice, 6(1), 51-56.
- Suprananto, K. (2012). Pengukuran dan Penilaian Pendidikan. Yogyakarta: Graha Ilmu.  
E. Unduh (Download) Resume Validitas Tes
  PDF
  Validitas Tes.pdf
Download
Rekomendasi:
- Prinsip-Prinsip Bimbingan dan Konseling (BK) Prinsip merupakan paduan hasil kajian teoretis dan telaah lapangan yang digunakan sebagai pedoman pelaksanaan sesuatu yang dimaksudkan. A. Konsep Dasar Prinsip-Prinsip Bimbingan dan Konseling (BK)Dalam pelayanan bimbingan dan konseling, prinsip-prinsip yang…
- Contoh Laporan Akhir Program Kampus Mengajar (KM)  Mempersiapkan peserta didik menghadapi transformasi sosial, budaya, dunia kerja, dan kemajuan teknologi yang pesat membutuhkan persiapan kompetensi agar peserta didik lebih responsif terhadap kebutuhan zaman. Persiapan ini meliputi keterkaitan dan…
- Hakikat Semantik: Konsep, Ruang Lingkup, dan Sejarah Semantik adalah cabang linguistik yang mempelajari makna atau arti. Semantik sebagai salah satu cabang linguistik memiliki kedudukan yang sama dengan cabang-cabang ilmu bahasa lainnya, yaitu fonologi, morfologi, dan sintaksis. Pada…
- Administrasi Kurikulum: Pengertian, Proses, dan Peran Guru Administrasi kurikulum adalah berbagai kegiatan yang bertujuan untuk melaksanakan dan mengembangkan kurikulum sehingga kurikulum dapat dijadikan sebagai instrumen dalam mencapai tujuan dan sasaran pendidikan. Di bawah ini, akan dijelaskan mengenai…
- Analisis Wacana Struktural: Wacana Deskripsi,… Wacana merupakan satuan kebahasaan yang lebih besar daripada kalimat dan klausa, dan terdapat hubungan antara satuan kebahasaan yang satu dengan yang lainnya. Para ahli telah membuat berbagai interpretasi wacana dan…
- Tes Keterampilan Berbicara: Konsep, Tingkatan, dan… Tarigan (1981), menyatakan bahwa berbicara adalah kemampuan mengucapkan bunyi-bunyi artikulasi atau kata-kata untuk mengekspresikan, menyatakan, serta menyampaikan pikiran, gagasan, dan perasaan.Tes berbicara adalah pengukuran untuk mengumpulkan informasi mengenai kemampuan seseorang…
- Kesantunan Berbahasa Leech dan Prinsip Kerja Sama Grice Dalam konteks komunikasi, prinsip kerja sama tidak dapat diterapkan dengan cara yang sama pada suatu masyarakat bahasa. Ada masyarakat yang dalam situasi tertentu lebih mementingkan prinsip kesantunan daripada prinsip kerja…
- Administrasi Sarana dan Prasarana: Pengertian,… Administrasi sarana dan prasarana adalah rangkaian kegiatan yang dilakukan untuk menunjang proses pembelajaran baik secara langsung maupun tidak langsung dengan memanfaatkan sumber daya manusia dan sumber daya alam yang ada…
- Kumpulan Buku untuk Mata Kuliah Wacana Bahasa Indonesia  Mata kuliah Wacana Bahasa Indonesia merupakan salah satu mata kuliah yang wajib diambil oleh mahasiswa di jurusan Bahasa dan Sastra Indonesia. Mata kuliah ini bertujuan untuk mengembangkan kemampuan mahasiswa dalam…
- Jenis-Jenis Makna dalam Semantik Ada banyak ragam makna dalam semantik. Berbagai ragam yang ada digunakan untuk mengelompokkan kata sesuai dengan fungsinya masing-masing. Berbagai makna dari berbagai sumber tersusun dari beberapa jenis. Pada pembahasan ini,…
- Perubahan Makna dan Penyebabnya Dalam bahasa Indonesia, kata yang bermakna kemungkinan besar akan berubah. Dalam waktu yang singkat arti kata tersebut akan tetap ada atau tidak berubah, tetapi dalam jangka waktu yang lama arti…
- Konsep Diksi dalam Semantik Seseorang memiliki kosakata yang terbatas dalam kehidupan sehari-hari, yang membuatnya sulit untuk mengungkapkan maknanya kepada orang lain. Sebaliknya, jika seseorang terlalu banyak menggunakan kosakata, maka akan sulit untuk menerima dan…
- Strategi Bertutur Trosborg: Latar Belakang dan Contohnya Bertutur adalah kegiatan mengucapkan kalimat-kalimat yang bermakna untuk memenuhi tindakan sosial tertentu, seperti berjanji, memberi nasihat, meminta sesuatu, dan lain-lain. Ada dua jenis tindak tutur, yaitu tindak tutur langsung dan…
- Tes Keterampilan Menyimak Sebagai satu dari empat keterampilan berbahasa, menyimak merupakan kemampuan yang memungkinkan seorang pengguna bahasa memahami bahasa yang digunakannya secara lisan. A. Konsep Dasar Tes Keterampilan MenyimakSebagai satu dari empat keterampilan berbahasa,…
- Analisis Wacana Kritis: Sejarah, Prinsip, dan Model Analisis wacana kritis adalah pendekatan konstruktivis sosial yang berpandangan bahwa representasi dunia adalah wacana secara linguistik, makna bersifat historis, dan pengetahuan diciptakan melalui interaksi sosial. A. Sejarah Analisis Wacana KritisKata…
- Administrasi Layanan Khusus: Pengertian, Jenis… Administrasi layanan khusus adalah suatu layanan yang secara khusus atau suatu usaha yang tidak secara langsung berkaitan dengan proses belajar-mengajar di dalam kelas. Namun, secara khusus diberikan oleh sekolah kepada…
- Struktur Wacana: Makro, Superstruktur, dan Mikro Wacana merupakan seperangkat preposisi yang saling terkait yang menciptakan semacam kohesi atau kepaduan bagi pendengar atau pembaca. Wacana dapat diimplementasikan dalam bentuk prosa lengkap (novel, buku, seri ensiklopedia, dll) atau…
- Medan Makna dalam Semantik Setelah membahas mengenai relasi makna, pada pembahasan ini kita akan melanjutkan mengenai medan makna. Medan makna adalah sekelompok elemen leksikal yang maknanya saling terkait karena menggambarkan bagian dari suatu budaya…
- Supervisi Pendidikan: Pengertian, Ruang Lingkup,… Supervisi merupakan bimbingan profesional bagi guru-guru, bimbingan profesional yang dimaksudkan adalah segala usaha yang memberikan kesempatan bagi guru-guru untuk berkembang secara profesional sehingga mereka lebih maju lagi dalam melaksanakan tugas…
- Hakikat Ilmu Pengetahuan dan Penelitian Ilmu adalah kumpulan pengetahuan yang sistematis, dan merupakan produk dari kegiatan penelitian dengan menggunakan metode ilmiah. Sedangkan Pengetahuan adalah segala tingkah laku manusia dalam memahami objek yang dihadapinya, dan hasil…
- Administrasi Peserta Didik: Pengertian, Proses,… Administrasi peserta didik adalah suatu cara atau langkah dalam kegiatan pembelajaran yang berkaitan dengan pendidikan yang bertujuan untuk menata dan mengatur pendidikan di sekolah agar tercapainya suatu kegiatan yang sesuai dengan…
- Penilaian Acuan Norma (PAN) dan Penilaian Acuan… Dalam pembelajaran dikenal ada dua jenis penilaian, yaitu Penilaian Acuan Norma (PAN) dan Penilaian Acuan Patokan (PAP). Perbedaan pada kedua acuan tersebut terletak pada asumsi atau cara interpretasi yang digunakan…
- Analisis Wacana Surat Menyurat: Hakikat, Struktur,… Surat merupakan alat komunikasi tertulis yang digunakan untuk menyampaikan informasi informasi suatu berita dari satu pihak ke pihak lain dengan adanya maksud atau isi yang terkandung dalam surat tersebut, baik…
- Sejarah Kajian Pragmatik: Pengertian, Objek, Ruang… Pragmatik adalah cabang linguistik yang membahas apa yang terkandung dalam struktur bahasa sebagai sarana komunikasi antara penutur dan pendengar, dan sebagai acuan tanda-tanda kebahasaan dalam membahas hal-hal ekstralinguistik. Pada pembahasan…
- Alat Evaluasi: Tes dan Nontes Alat evaluasi merupakan alat yang digunakan untuk memudahkan seseorang dalam melakukan tugas atau mencapai tujuan dengan lebih efisien dalam kegiatan evaluasi. Dalam kegiatan evaluasi, peran alat evaluasi sangat menentukan untuk…
- Pentingnya Administrasi dan Supervisi Pendidikan:…  Administrasi pendidikan merupakan subsistem dari sistem pendidikan di sekolah yang bertujuan untuk mendukung tercapainya tujuan pendidikan secara efektif dan efisien. Pada pembahasan ini, kita akan menjelaskan mengenai bagaimana pentingnya mempelajari…
- Komponen Medan Makna dalam Semantik Komponen medan makna atau komponen semantik mengajarkan bahwa setiap kata atau elemen leksikal terdiri dari satu atau lebih elemen yang bersama-sama membentuk makna kata atau makna elemen leksikal. Analisis ini…
- Pendekatan dan Model Pelayanan Komprehensif… Bimbingan dan konseling komprehensif dirancang untuk merespons berbagai persoalan yang dihadapi oleh konselor di sekolah.A. Konsep Dasar Bimbingan dan Konseling (BK) KomprehensifBimbingan dan konseling komprehensif dirancang untuk merespons berbagai persoalan…
- Tes Keterampilan Menulis: Konsep, Tingkatan, Model… Keterampilan menulis merupakan salah satu bentuk komunikasi tidak langsung, bukan pertemuan dengan orang lain secara langsung. A. Konsep Dasar Tes Keterampilan MenulisMenulis adalah kegiatan yang produktif dan ekspresif. Faktanya, menulis adalah…
- Hakikat Evaluasi: Konsep, Ciri, Objek, dan Fungsi Evaluasi adalah serangkaian kegiatan yang ditujukan untuk mengukur keberhasilan pada program pendidikan. Evaluasi juga dapat dipandang sebagai proses merencanakan, memperoleh, dan menyediakan informasi yang sangat diperlukan untuk membuat alternatif-alternatif keputusan.…