6. 2. 2006
RSS backend
PDA verze
Čtěte Britské listy speciálně upravené pro vaše mobilní telefony a PDA
Reklama
Reklama
Celé vydání
Archiv vydání
Původní archiv

Autoři

Vzkaz redakci

OSBL
Tiráž

Britské listy

http://www.blisty.cz/
ISSN 1213-1792

Šéfredaktor:

Jan Čulík

Redaktor:

Karel Dolejší

Správa:

Michal Panoch, Jan Panoch

Grafický návrh:

Štěpán Kotrba

ISSN 1213-1792
deník o všem, o čem se v České republice příliš nemluví
3. 2. 2006

Software, vyhledávající plagiáty, je poskytován jako služba

Se zájmem jsem si přečetl poznámku Štěpána Kotrby u článku Studenti si seminárky z internetu volně stahují. Reakce je formulována velmi dobře, ale vychází z nepřesných informací, píše čtenář Petr Nachtmann.

Autor polemizuje s větou "Kromě toho existují programy, které zjistí, zda je práce zplagiarizována z internetu" a argumentuje takto:

"Poslení věta je technologickým nesmyslem. Předpokládá, že lze soubor, zazipovaný na cizím, neznámém serveru kdekoliv na internetu přečíst a prohlédnout fulltextovým prohledávačem."

Software pro detekci plagiátů je často poskytován jako služba. I kdyby poskytovatel systému neměl přístup k online burzám textů pro plagiátory, lze očekávat, že tyto burzy využívají plagiátoři mezi studenty. Pokud je do systému zadán prakticky totožný text od různých studentů z různých škol, je jasné, že se jedná o plagiát.

Sbírky textů pro plagiátory se, pokud vím, v angličtině nazývají Internet paper mills - ZDE ZDE.

Autor pokračuje : "Předpokládá výskyt technologií, za které by nejspíše i Google dal nevímco."

Google tyto technologie vyvíjí a používá. Slouží například ke zjišťování webových stránek, které jsou pouze zrcadly (mirrory) jiných -- při vyhledávání nemá většinou smysl vracet stránky s totožnými texty.

Služba Google News shlukuje vzájemně podobné texty ze zpravodajství a zcela redundantní texty se snaží zatlačit do pozadí -- pokud víc novin či zpravodajských serverů přebírá totožnou zprávu ze zpravodajské agentury, čtenáři tato zpráva stačí jednou. Když zkusím zadat klíčové slovo Paroubek, vidím cluster výsledků věnovaný zdravotnictví, Nejvyššímu soudu, vtipům o Romech, programové konferenci ČSSD a termínu voleb.

Je samozřejmě nutné dobře stanovit práh míry podobnosti textů, rozlišovat mezi podobností textů zabývajících se stejným tématem a plagiáty.

Zpravodajské články clusterují v reálném čase také české servery novyden.cz a prehled.net. Systémy pro detekci velmi podobných variací pomocí digitálních otisků jsou také součástí některých antispamových systémů - nilsimsa, Vipul's Razor, Cloudmark. Spammeři totiž rádi posílají své zprávy jednotlivým adresátům s drobnými odchylkami, například mohou být hypertextové odkazy personalizovány. Po kliknutí na může spammer identifikovat e-mailovou adresu důvěřivce, který se nechal na jeho nabídku nachytat.

Jako kritéria hodnocení podobnosti textů můžeme využít mnoho různých algoritmů a jejich kombinací, například kosínovou podobnost , Kolmogorovovu složitost či porovnávání digitálních otisků - nilsimsa, Vipul's Razor.

Svoji poznámku autor uzavírá:

"A nebo se na to vykašlat a zadávat taková témata, která okopírovat prostě nelze. Ale to znamená i od pedagoga inteligenci, kreativitu a zvýšený zájem..."

Má naprostou pravdu.

                 
Obsah vydání       6. 2. 2006
6. 2. 2006 Británie bohatství a bídy, 2006
6. 2. 2006 Islámští demonstranti v Londýně zřejmě budou čelit trestnímu stíhání
6. 2. 2006 Americká média "se chovají ostudně"
6. 2. 2006 Viktorie Petr  Pojar
6. 2. 2006 Náklady války v Iráku a v Afghánistánu dosáhnou 440 miliard dolarů
6. 2. 2006 Amerika: Soukromá data z internetu se intenzivně využívají v trestním vyšetřování i civilních soudních sporech
6. 2. 2006 "Za 15 let budeme zřejmě prodávat daleko tenčí noviny za 100 Kč" Jan  Čulík
4. 2. 2006 Bulvární úzkost českých šéfredaktorů Jan  Čulík
6. 2. 2006 Benešovy zákony Emanuel  Mandler
6. 2. 2006 Jde o následovníky, nikoliv pamětníky Vlastimil  Balín
6. 2. 2006 Luciferův ráj aneb úvaha nejen o kovbojích v sukni Karel  Moudrý
6. 2. 2006 Unipetrol: Jde médiím opravdu o pravdu? Pavel  Hojda
6. 2. 2006 Václav Žák k obvinění z "klamavé reklamy" Václav  Žák
3. 2. 2006 Software, vyhledávající plagiáty, je poskytován jako služba Petr  Nachtmann
6. 2. 2006 Řecká vláda přiznává, že se stala obětí místní verze skandálu Watergate
6. 2. 2006 Dánské velvyslanectví v Bejrútu bylo podpáleno
6. 2. 2006 Ségolène je pro Blaira Simone  Radačičová
6. 2. 2006 Endymión Boris  Cvek
5. 2. 2006 Lidé čtěte !
6. 2. 2006 Plagiátorství má jednoduché řešení Ondřej  Slačálek
6. 2. 2006 Všeobecná deklarace lidských práv by neměla být modlou Luboš  Zálom
6. 2. 2006 Mluvící bubliny a nafouklá identita Česka Štěpán  Kotrba
6. 2. 2006 Zmanipulované gény Sylvia  Rychlá
4. 2. 2006 Soud zastavil stavbu dálniční křižovatky v Praze na Malovance
3. 2. 2006 Vydali byste v Německu antisemitské kreslené vtipy?
3. 2. 2006 Bylo správné či nesprávné zveřejnit ty karikatury?
3. 2. 2006 Štěk Bohumil  Kartous
3. 2. 2006 Vzdělanostní společnost, univerzity a kvalita vzdělání Boris  Cvek
3. 2. 2006 Civilizační retardace a katalyzátory modernosti Martin  Škabraha
3. 2. 2006 Znovu o víře, rouhání, Bohu a ironii
2. 2. 2006 Britské listy mají za rok o polovinu více čtenářů
2. 1. 2006 Hospodaření OSBL za prosinec 2005
22. 11. 2003 Adresy redakce