Hodnocení vědy: Postrádá odbornost?
21. 6. 2010
Prof. Jana Musilová, působí v Ústavu teoretické fyziky a astrofyziky Přírodovědecké fakulty Masarykovy univerzity v Brně a zároveň je na téže univerzitě prorektorkou pro vědu a výzkum. Prof. Musilová je mimo jiné místopředsedkyní Odborné skupiny Organizace výzkumu České fyzikální společnosti Jednoty českých matematiků a fyziků. Na pravidelných setkáních Akademického fóra, která tato odborná skupina organizuje, opakovaně prezentovala své analýzy Metodiky hodnocení výsledků vědy a výzkumu. Protože nás jako iniciativu "Už se na to nemohu dívat" velmi zaujalo, jak své kritické názory vůči Metodice zakládá na fundovaných rozborech samotného dokumentu a veřejně dostupných dat a na konfrontacích s reálnými údaji o stavu české vědy a výzkumu, požádali jsme ji o vyjádření. Prof. Musilové jsme položili několik otázek mapujících jak věcné aspekty Metodiky, tak i procedury jejího vzniku.
Dlouhodobě se věnujete analýzám Metodiky hodnocení výsledků vědy a výzkumu, kterou vypracovala Rada pro výzkum a inovace. Metodika doznala v průběhu přípravy řady změn. Které jsou podle Vás ty nejpodstatnější? Jednalo se podle Vás o změny k lepšímu?
Poněkud bych znění vaší otázky poopravila. Rada pro výzkum, vývoj a inovace, dříve Rada pro výzkum a vývoj, Metodiku nevypracovala, ale pouze schvalovala. (A protože Rada rozhoduje hlasováním, není vyloučeno, že si někteří její členové nepřipouštějí za výsledek osobní odpovědnost.) V první fázi tvořil Metodiku zřejmě sekretář Rady pro výzkum a vývoj, později poradní orgán Rady -- Komise pro hodnocení výsledků vědy a výzkumu (VaV), které sekretář předsedal.
Ale k otázce: Takzvaná "Metodika hodnocení výzkumu a vývoje a jejich výsledků" má u nás již sedmiletou historii. Zdálo by se, že je to dostatečná doba na to, aby odborně fundovaná koncepce hodnocení kvalitativní úrovně a efektivity výzkumné činnosti mohla být formulována, propracována po věcné i technické stránce, otestována, vyhodnocena a uplatněna v praxi. Oprávněná očekávání, že tomu tak bude, však zůstala nenaplněna.
První z "metodik", Metodika 2004, si pouze kladla za cíl rozdělit výzkumné instituce do tří skupin podle toho, jak "zhodnotily vynaložené prostředky". Nejlepší skupině se měla finanční podpora ze státního rozpočtu zvýšit, prostřední zachovat, nejhorší snížit. Započítávaly se, zjednodušeně řečeno, pouze výsledky vykázané na projektech CEZ (Centrální evidence výzkumných záměrů) a CEP (Centrální evidence projektů) ukončených v pětiletém období předcházejícím období hodnocení. Důležité bylo, jak velké prostředky ze státního rozpočtu instituce na řešení projektů vynaložila. Nebyly zavedeny žádné kvantitativní parametry, pomocí nichž by k rozčlenění institucí mohlo dojít. V dokumentu se uvažovalo o možných vahách výsledků s tím, že budou obsaženy v dodatku k metodice. Z toho hlediska šlo o přípravnou fázi následujících Metodik, které již byly založeny na kvantitativních ukazatelích.
V dalších Metodikách byly postupně použity dva zcela odlišné principy hodnocení. První z nich, založený na takzvaném Indexu SR, byl použit v Metodikách 2005 až 2007, druhým je princip metody známé jako "kafemlejnek". Lze tedy říci, že podstatná změna se konala pouze jedna. Předesílám, že ji považuji za změnu typu "z bláta do louže", a můžete si vybrat, je-li horší bláto, nebo louže. Oba principy jsou totiž z odborného hlediska pochybené. Pokusím se podstatu věci stručně vysvětlit.
V Metodikách 2005 až 2007 bylo "hodnocení" založeno na jednom kvantitativním ukazateli "efektivity institucí", již zmíněném Indexu SR -- zkratka SR zde znamená státní rozpočet. Ten byl definován jako podíl celkové váhy výzkumných výsledků vykázaných na ukončené projekty v předchozích pěti letech a celkové výše finančních prostředků ze státního rozpočtu v milionech korun, tedy váha (nikoli prostý počet) výsledků "pořízených" za milion.
Na předních místech pomyslného žebříčku efektivity se tak držela populární Pekárna Žatec, která za pět let vykazovala třetinu projektu, dva a půl výsledku, ale pořídila je lacino. Zásadní odborný lapsus metody však spočíval v tom, že Metodika předem, bez znalosti skutečného rozdělení hodnot parametru Index SR, určovala, v jakém rozmezí hodnot tohoto "parametru hodnocení efektivity" bude instituce považována za podprůměrnou, průměrnou, nadprůměrnou. Za takovou chybu subbakalářské úrovně by byl student prvního semestru přírodovědného nebo technického oboru nemilosrdně odkázán na opravný termín zkoušky či zápočtu z praktika.
Přes kritiky připomínkových míst i přes výsledky vyplývající z metodiky se tehdejší RVV nechtěla Indexu SR vzdát. I když viděla, že naprosto nefunguje, protože pro různé právní formy institucí dává zcela nesouměřitelné výsledky, nepřehodnotila princip, ale měla v úmyslu provádět umělé úpravy hodnocení tak, aby pro instituce různé právní formy dosáhla vyrovnání. Naštěstí zůstalo jen u úmyslu, neboť použití tzv. sektorového koeficientu, který měl toto vyrovnání zajistit, nebylo schváleno. Místo aby si RVV uvědomila, že potřeba umělých úprav je fakticky doznáním nepoužitelnosti metody, nevzdala se jí v podstatě dodnes. Používá Index SR pro hodnocení efektivity výzkumných programů.
Dalšími změnami Metodiky, které zřejmě máte svou otázkou na mysli, byly pouze "licitace" týkající se změn vah jednotlivých typů výsledků a jejich definic. Úmyslně říkám licitace. Nešlo o úvahy podložené analýzami, nebyla brána v úvahu oborová specifika výzkumu ani jeho nákladnost. (Experimentální výzkum vyžadující nákladnou přístrojovou techniku musel tedy nutně vycházet jako neefektivní.) Všimněte si, že pro hodnocení efektivity nebylo podstatné, jaká je obsahová hodnota výsledku, co přináší pro rozvoj poznání, pro praxi, atd. Toto je společný rys všech dosavadních Metodik.
Jaké jsou tedy principy současné Metodiky? Jaké jsou podle Vás její největší slabiny? Má naopak i nějaké přednosti?
Druhý princip, uplatňovaný u současných Metodik, tj. Metodiky hodnocení výsledků VaV 2008, 2009 a 2010 pro případ výzkumných organizací (institucí), je diametrálně rozdílný od předchozích verzí. Úroveň výzkumné organizace je kvantifikována pomocí souhrnné bodové hodnoty výsledků. Hodnotící ukazatel tedy již není relativní, ale absolutní. Každý typ výsledku dostane svou váhu, sečtou se váhy výsledků každé instituce. Jednotlivé instituce se podle této jediné hodnoty umístí na univerzální stupnici. Poloha na této stupnici v podstatě určuje výši institucionálního financování. Podle celkové váhy výsledků všech organizací spadajících pod jednoho poskytovatele (správce kapitoly státního rozpočtu, který, stručně řečeno, spravuje peníze "svých" institucí) se tomuto poskytovateli přidělí institucionální finanční prostředky, aby je institucím nějak rozdělil, přičemž rozdělení může modifikovat na základě vlastního hodnocení. To je princip onoho pověstného "kafemlejnku". Princip velmi prostý -- trojčlenka, která již nevyžaduje ani myšlení na oné subbakalářské úrovni, stačí základní škola. Jediná přednost současných Metodik oproti minulým, která ovšem netkví v jejím principu, je započítávání všech výsledků výzkumu, nikoli jen těch, které jsou vázány na projekty CEZ a CEP. To ostatní jsou slabiny. Pokusím se stručně charakterizovat jen ty nejhrubší. Peripetie a tahanice kolem stanovení vah a často nesmyslných definic výsledků (kniha je definována počtem stran a výší nákladu, apod.) vynechám:
- Metodika, založená na sumární váze výsledků, má podle preambule uvedené v příslušném dokumentu sloužit k diferencovanému rozdělení prostředků na poskytovatele. Analýzy však ukazují to, co člověk i jen velice málo zběhlý v počítání odhadne předem. U velkých institucí či skupin institucí to dopadne tak, že budou financovány zhruba podle "mohutnosti", konkrétně podle celkové výše pracovních úvazků výzkumníků. Abychom k tomuto zjištění došli, nebylo přece třeba propracovávat nějakou metodiku, která notabene zcela ignoruje další aspekty důležité pro rozhodování o institucionálním financování, jako jsou provozní odlišnosti či kombinace výzkumu s dalšími typy činností institucí. To například letos, kdy se poprvé podle Metodiky rozdělily institucionální prostředky na rozvoj výzkumných organizací, dopadlo na Akademii věd ČR. Jednoduše má asi 2,2-krát méně úvazků připadajících na výzkum než veřejné vysoké školy, počítáme-li zjednodušeně, že akademičtí pracovníci na vysokých školách se polovinou své kapacity věnují výuce, druhou polovinou výzkumu.
- Nelze hodnotit úroveň, resp. efektivitu výzkumu instituce jen pomocí kvantity a používat toto "hodnocení" k rozdělování finančních prostředků, jak to činí Metodika. Body za výsledky se totiž přidělují bez ohledu na jejich obsah a kvalitu. Finanční prostředky tak instituce získává úměrně množství bodově vážených výsledků, a je jedno, jaká je jejich kvalitativní úroveň.
- Nelze zadat, resp. charakterizovat, vícerozměrnou entitu , k níž lze úroveň instituce ve výzkumu bezpochyby přirovnat, jen jednou její složkou. Velmi zjednodušeně řečeno -- například pro zadání polohy na zeměkouli nestačí jen nadmořská výška a ani jakákoli jiná jediná hodnota spočtená pomocí nadmořské výšky, zeměpisné šířky a zeměpisné délky; potřebujete prostě všechny tři tyto údaje.
- Umístění instituce na univerzální stupnici nedává smysl. Metodika nerespektuje oborově specifické publikační zvyklosti ani významně odlišnou finanční náročnost výzkumu v různých oborech. Mé vlastní rozbory ukazují, že aplikace Metodiky významně poškozuje humanitní a společenskovědní disciplíny. Aby se typický odborník v těchto vědách bodově vyrovnal typickému přírodovědci, nadře se v průměru dvaapůlkrát více co do počtu výsledků.
- Metodika dává různou váhu různým typům výsledku, a to bez ohledu na obsahovou hodnotu konkrétního výsledku. Nelze hovořit o hodnocení vědy, nezajímáme-li se o kvalitu. Další neodbornost spočívá v přidělení paušálního bodového hodnocení všem typům výsledků s výjimkou "sofistikovaného" vážení impaktovaných publikací pomocí spojité váhové funkce závislé na pořadí impaktního faktoru časopisu v rámci dané oborové skupiny časopisů. Je to podobné, jako byste v obrovské místnosti vytrvale zametali jeden čtvereční metr podlahy a mysleli, že máte uklizeno všude.
A to nehovořím o tom, že sama volba konkrétní funkce ve tvaru hyperboly a její meziroční změny nejsou výsledkem analýz. Vzhledem k tomu, že mé vlastní rozbory ukazují, že meziroční změna váhové funkce, například v Metodice 2009 oproti 2008, přinese v podstatě nerozeznatelnou změnu při rozdělení peněz na poskytovatele, neumím si to vysvětlit jinak, než že si některý tvůrce Metodiky vylepšuje změnami asymptot a strmosti hyperboly své vlastní bodové hodnocení. V případě jednotlivce taková změna velmi dobře "zabírá".
- Podstatnou slabinou technického provedení Metodiky je obrovský nepořádek v RIV . I kdyby princip Metodiky byl správný, bude zcela znehodnocen chybami při přidělování bodů. A ty jsou prokazatelné a doložitelné na konkrétních případech. Pracovníci týmu Informačního systému MU vyvinuli aplikaci, pomocí které si každý pracovník MU může zkontrolovat body za své publikace přidělené RVVI. Při kontrole svých publikací jsem zjistila chyby v bodování, u nichž se ani nedá přijít na kloub tomu, jak vznikly. Tyto chyby byly obojího druhu -- někdy mi RIV neprávem body ubral, jindy přidal.
- A konečně -- funkčnost, nebo lépe nefunkčnost Metodiky nenechala RVVI nikdy kvalifikovaně prověřit na konkrétních datech, přestože datové soubory v RIV jsou již naprosto dostatečné k takovým analýzám. Alespoň nevím, že by takové analýzy existovaly, neboť naše žádosti o jejich poskytnutí byly velmi důsledně ignorovány.
Sami tvůrci Metodiky již nyní docházejí k poznání, že je vadná, i když to explicitně nepřiznávají. Jinak by v její nejnovější verzi pro rok 2010 nenavrhovali nesystémové úpravy bodového hodnocení, pomocí kterých zajistí,
- aby byl dodržen předem zadaný poměr financování základního a aplikovaného výzkumu,
- aby byly dodrženy, s tolerancí 15 %, předem zadané poměry financování v jednotlivých oborových skupinách, opět stanovené předem na základě výsledků starých Metodik, zcela nelogicky s omezením pouze na výsledky výzkumných záměrů,
- aby nárůst bodů za některý typ výsledků nepřekročil 1,5 násobek nárůstu bodů za všechny výsledky.
Očekávání inflace, a tedy zákonitě kvalitativní znehodnocení výsledků, je z avizovaných úprav zcela zřejmé. Navíc -- kdybychom k akceptování Metodiky byli nakonec přinuceni, nebudeme moci provádět žádné výhledy týkající se financí. Jestliže totiž bylo zatím obtížné, aby si instituce sama předem dokázala odhadnout výši prostředků, které by mohla za výsledky získat, bude to nyní téměř nemožné. Nikdo nebude předem vědět, k jakým umělým úpravám dojde a jaký bude pokles finanční hodnoty bodu v různých oborech a za různé typy výsledků.
Další "inovační krok" v Metodice 2010 je oproti těm předchozím pouhou kuriozitou: Všechny publikace označené jako monografie budou navezeny na Úřad vlády, kde se jich ujmou členové poradních orgánů RVVI a budou je třídit do pěti skupin podle kvality. Uvážíme-li, že v pětiletém období je vykázáno vždy zhruba 13 000 monografií, připadá jich na jeden rok 2 600. Na jejich ohodnocení bude čas asi 5 měsíců, přičemž členů poradních orgánů RVVI je sotva 40. Počtou si tedy docela dobře. I když -- právě proběhly nominace kandidátů do poradních orgánů RVVI, možná se počet členů skupin mnohonásobně zvýší.
Jaké jsou a do budoucna ještě mohou být dopady stávající podoby Metodiky na fungování vědy? Které z těchto dopadů považujete za příznivé a které za nebezpečné?
Očekávané dopady Metodiky jsou vesměs nebezpečné, žádné příznivé nevidím. Zejména pokud bude Metodika 2010 konzervována usnesením vlády na další tři roky, mohou být podle mého názoru fatální. Některé z nich se projevují už nyní.
- O tom, že honba za body, která nabývá obludných rozměrů již nyní (a to se podle Metodiky financovat teprve začalo), povede k inflaci výsledků a snížení jejich kvalitativní úrovně, jsem už hovořila. Krédem opět bude, často i dokonce již je -- "publikuj (je jedno co), nebo zahyneš".
- Vědci se začnou chovat účelově. Struktura bodového hodnocení za výsledky už nyní ukazuje na riziko, že se v přírodovědných a lékařských oborech přestanou psát knihy -- je to totiž bodově nevýhodné.
- Ačkoliv ti, jimž je nekvalifikovanost Metodiky zřejmá, neustále varují před její aplikací na menší týmy či útvary, nebo dokonce na jednotlivce, projevuje se prapodivná soutěživost bohužel i u vzdělanců. Nejsou výjimkou vedoucí pracovníci, kteří by rádi vytvářeli žebříčky vědecké výkonnosti jednotlivců, kateder, týmů, ústavů. A jednotlivci sbírají "vědecké bobříky" jako nálepky nebo kuličky.
- I kdyby Metodika měla nějaká opodstatnění, neobsahuje absolutně žádný motivační prvek za předpokladu, že se celkové prostředky na rozvoj institucí nebudou navyšovat. Při tomto "zákonu zachování" je zřejmé, že i kdyby všechny instituce zvýšily svůj výkon, jen se navýší prostředky některým a jiným klesnou. Vzhledem k tomu, že vysoce výkonné instituce budou pravděpodobně blízké stavu "nasycení" a nebudou moci svůj výkon již podstatně zvyšovat, doplatí na instituce dosud málo výkonné, které mají značné rezervy. Zdá se to možná divné, ale je to tak.
Jsou podle Vás tyto dopady záměrem autorů Metodiky, nebo se spíše jedná o nezamýšlené důsledky?
Kdybych se chtěla vyjádřit hodně ostře, řeknu, že neználkovství obvykle nebývá úmyslné. V případě Metodiky však věc není tak jednoznačná. Jsem přesvědčena, že hlavní tvůrci Metodiky v Komisi pro hodnocení výsledků opravdu upřímně věří tomu, co vytvářejí. Proti nim stojí vytrvalí kritikové.
Je třeba si ale uvědomit, že tento spor se týká pouze jedné části ze zhruba 25 miliard Kč celkových prostředků na vědu, a to institucionálních prostředků určených na rozvoj institucí. V roce 2010 šlo o necelé 3 miliardy, po skončení výzkumných záměrů by odhad mohl činit kolem 11 miliard. A platí pořekadlo "když se dva perou, třetí se směje". Tím třetím je průmysl, tedy firmy. Inkasují peníze na experimentální vývoj a inovace, což je krycí název pro odliv prostředků vykazovaných na vědu fakticky do výroby. Takovou "taktiku" za úmyslnou považuji.
Jaký by byl podle Vás adekvátní způsob hodnocení vědy a výzkumu? V čem by se lišil od stávající Metodiky? Jaký by podle Vašeho názoru měl být vztah mezi hodnocením výsledků a financováním vědy?
Každý rozumný způsob hodnocení čehokoli, kde hraje roli kvalita, musí být založen na hodnocení kvality. Se stávající Metodikou tedy nebude mít společného nic. Vhodně definované kvantitativní ukazatele mohou hrát orientační úlohu. V zahraničí se metody kvalitativního hodnocení prostřednictvím expertních skupin, tzv. peer review (nestranné posouzení), běžně používají. Stačilo by se poučit tam. Jediným poskytovatelem, který provádí obdobné hodnocení, je Akademie věd ČR, která spravuje samostatnou rozpočtovou kapitolu. Jsem předsedkyní jedné z hodnotících komisí při právě probíhajícím hodnocení a shledávám na něm mnoho pozitivního, co by mohlo být základem obecně přijatelné metodiky. Myslím, že má-li být financování institucí nikoli paušální podle velikosti instituce, ale diferencované podle výkonu, musí být s výsledky rozumně koncipovaného hodnocení částečně spjato.
Vyjadřujete se k Metodice již řadu let. Jak na Vaše analýzy reagovala RVVI a akademické instituce?
Už samotnou formulací otázky správně míříte. Připomínková místa, a tedy i všichni, kteří pro ně připomínky zpracovávali a zpracovávají, včetně mne, se k Metodice pouze "vyjadřují". Jakkoli jsou některá vyjádření kritická (například ta, která zaznívají na Akademických fórech pořádaných každý měsíc Odbornou skupinou Organizace výzkumu České fyzikální společnosti Jednoty českých matematiků a fyziků -- http://cms.jcmf.cz/osov), nestačí to.
Připomínková řízení mají již svůj téměř rituální průběh. Instituce jsou vyzvány k formulaci připomínek v tak krátké lhůtě, ve které takřka není možné je solidně zpracovat. Jestliže jsem dříve na otázku, zda chyby v Metodice jsou úmyslné, odpověděla negativně, pak krátkost lhůt v připomínkových řízeních za záměr považuji. Pokud instituce přece jen připomínky formuluje a ve lhůtě předloží, dochází k jejich kurióznímu "vypořádání" sekretářem RVVI. Převážná většina zásadních připomínek není respektována se zdůvodněním, které signalizuje buď nekvalifikovanost, nebo explicitní projev vědomí moci. Možná obojí.
Neskončím však u této jednostranné kritiky. Druhou její část, tu podstatnější, musím bohužel zamířit vůči akademické obci samotné. V průběhu celé historie Metodiky akademická obec a její oficiální reprezentace poměrně nedůstojnou roli připomínkových míst trpěly a fungovaly tak ve prospěch Metodiky jako "odborné krytí". RVVI argumentovala tím, že připomínková místa, včetně akademických institucí, Metodiku v rámci připomínkových řízení schválila. Ze strany reprezentací akademické obce nebyla vyvinuta iniciativa, která by směřovala k využití nepochybně značného intelektuálního potenciálu vlastních institucí pro tvorbu koncepcí organizace, hodnocení a financování vědy na celostátní úrovni. Snad je ještě možnost to napravit. Zárukou nápravy by mohly být i některé osobnosti nově jmenované RVVI.
VytisknoutObsah vydání | Pondělí 21.6. 2010
-
20.6. 2010 / Brutální škrty, které navrhuje vláda, jsou nesmyslné21.6. 2010 / Hodnocení vědy: Postrádá odbornost?21.6. 2010 / Důchody a nároky21.6. 2010 / Firma BP "lhala Kongresu"21.6. 2010 / Polsko odmítlo Jaroslawa Kaczynského21.6. 2010 / Vysoký vatikánský kardinál je vyšetřován pro korupci21.6. 2010 / Rusko omezuje dodávky plynu neplatícímu Bělorusku21.6. 2010 / Británie se bouří proti rozpočtovým škrtům21.6. 2010 / Blažek: Není možné dělat politiku bez ideologie19.6. 2010 / Německá vládní koalice je na pokraji kolapsu19.6. 2010 / 2000 mrtvých v Kyrgyzstánu18.6. 2010 / K případu West Dean18.6. 2010 / Státní dluh jsou peníze, které vláda dluží nám!18.6. 2010 / Kalkulační pochybení Paula Segala18.6. 2010 / Banky a ratingové agentury18.6. 2010 / Daniel VeselýObamova vláda je spoluviníkem při zamlčování informací o katastrofě v Mexickém zálivu2.5. 2010 / Hospodaření OSBL za duben 2010