Przez pokolenia edukacja opierała się na zasadniczym błędzie: założeniu, że standaryzowane testy dokładnie mierzą umiejętności. Rzeczywistość jest znacznie bardziej skomplikowana. Od Isaaca Newtona mającego problemy ze zdaniem egzaminu z fizyki na tablecie po uczniów neuroróżnorodnych niesprawiedliwie karanych surowymi formatami – nasze obecne systemy często mierzą przeszkody, a nie zdolności poznawcze. Pojawienie się sztucznej inteligencji stanowi zarówno zagrożenie, jak i szansę. Jeśli nie zajmiemy się podstawowymi brakami w ocenianiu, sztuczna inteligencja po prostu zautomatyzuje i wzmocni istniejące uprzedzenia, utrwalając szkodliwe przekonania na temat potencjału uczniów.

Mit obiektywnego pomiaru

Tradycyjna edukacja opiera się na błędnym założeniu: talent jest rzadki, geny determinują przeznaczenie, a zdolności można łatwo uszeregować na krzywej dzwonowej. Współczesna nauka o uczeniu się temu zaprzecza. Potencjał ludzki jest głęboko plastyczny, dynamicznie kształtowany przez środowisko i obficie rozproszony. Każde dziecko rodzi się, aby się uczyć, ale nasze systemy często mówią im inaczej.

Ta rozbieżność wynika z złych pomiarów. Standaryzowane testy często mierzą zdolność ucznia do poruszania się po teście, a nie podstawową wiedzę. Generuje to „patologiczne wyjaśnienia” poprzez fałszywe obwinianie różnic w nauce, zamiast dostrzegać ograniczenia w ocenianiu. W psychometrii zjawisko to nazywa się niewielką zmiennością zewnętrzną : gdy test raczej ukrywa niż ujawnia prawdziwe zdolności.

Trzy zasady godziwej wyceny

Aby oddzielić sygnał od szumu, musimy przyjąć trzy podstawowe zasady:

  1. Równość nie oznacza tożsamości: Zmuszanie każdego ucznia do stosowania tych samych warunków ignoruje samą istotę neuroróżnorodności. Pszczoła ortograficzna wymagająca ustnej recytacji karze uczniów z wadami wymowy — przeszkoda tłumi rzeczywistą umiejętność ortografii. Zezwolenie na wprowadzanie danych z klawiatury usuwa tę niepotrzebną przeszkodę bez uszczerbku dla rygoru.
  2. Warunki równoważne nie gwarantują równoważnych dowodów: Standaryzowane badanie wzroku wymaga stałej odległości od wykresu. Jednak zmuszanie niewidomego ucznia do czytania z tej samej odległości po prostu sprawdza jego wzrok, a nie znajomość alfabetu. Następnie test mierzy wzrok, a nie uczenie się.
  3. Główna zmienność zapewnia równoważny dowód: Celowe dostosowanie sposobu realizacji zadań do różnych uczniów może dać dokładniejsze wyniki. Nawet gdyby sam Izaak Newton otrzymał komputerową symulację fizyki, jego geniusz zostałby ukryty z powodu braku umiejętności cyfrowych. Zapewnienie alternatywnych formatów gwarantuje, że mierzymy geniusz, a nie wygodę technologiczną.

Widelec dla AI

Przez dziesięciolecia niewielki szum tła był nieuniknioną wadą testów papierowych. Sztuczna inteligencja zapewnia nam teraz niespotykaną dotąd moc obliczeniową, dzięki której możemy personalizować oceny i usuwać te bariery na dużą skalę. Ale sztuczna inteligencja to silnik wnioskowania. Wzmocni wszelkie dane, które mu przekażemy.

Stoimy przed krytycznym wyborem:

  • Ścieżka B: Szkodliwość skalowania: Ślepe wstawianie uszkodzonych testów do algorytmów automatyzuje słabe pomiary, przyspieszając tendencyjną dystrybucję i utrwalając fałszywe przekonania na temat autorytetu algorytmów.
  • Ścieżka A: Spełnienie obietnicy: Dostrojenie sztucznej inteligencji w celu wyeliminowania szumów i sygnałów świetlnych zapewni spersonalizowaną informację zwrotną, wzmacniającą pozycję uczniów i prowadzącą do ciągłego doskonalenia.

Jeśli zaliczenie testu wymaga przeskoczenia niepowiązanej przeszkody, oznacza to niezaliczenie egzaminu. Zmieniając nasze ramy psychometryczne, możemy przejść od patologizowania uczniów do wzmacniania ich. Pytanie nie brzmi: „Co jest nie tak z tym uczniem?”, ale „Co należy poprawić w tej ocenie?”

Przyszłość uczenia się zależy od naszej zdolności do uznania, że ​​inteligencja nie jest stałą cechą, ale dynamicznym potencjałem i że nasze narzędzia muszą się dostosowywać, aby ujawniać, a nie ukrywać ludzki geniusz.