Некоторое время тому назад ко мне обратился молодой человек, предложивший свою статью для публикации в нашем журнале. Следует сказать, что материал сразу вызвал сомнения — слишком неровно он был написан. Фрагменты текста различались по стилю, а в некоторых абзацах была масса грамматических и стилистических ошибок. Вызывало подозрение и оформление работы: непонятно, почему автор использовал разные шрифты и способы форматирования абзацев. Правда, стоит признать, что мне попался «идеальный» случай, и определить то, что материал скопирован из Интернета, не составило труда. Достаточно было включить в браузере опцию отображения служебных символов (кнопка  на панели меню), и все стало ясно. В общем, если в каком-то куске текста присутствуют знаки разрыва строки () или неразрывные пробелы (º), то с вероятностью 99,99% можно сделать вывод, что этот фрагмент скопирован из браузера и вставлен в документ. Конечно, может случиться и так, что текст действительно авторский и просто был опубликован им, например, в блоге. Поэтому следующая задача — установить факт плагиата и выяснить истинное авторство.

В описываемом случае поиск первоисточников проводился самым нехитрым способом — с помощью поисковой системы «Яндекс». Из текста были выбраны фразы, которые вызывали наибольшее подозрение и поиск по которым казался результативным. Ну, например: «Общий вес конструкции равнялся весу четырех африканских слонов» или «Проект создания ENIAC можно сравнить с постройкой пирамиды Хеопса или древнеримского Колизея». Каково же было мое удивление, когда результаты поиска привели меня на сайт нашего издательства «Открытые системы», — недобросовестный автор не постеснялся безвозмездно воспользоваться материалами моих коллег! Впрочем, среди первоисточников оказалось еще несколько сайтов. Таким образом, факт плагиата был доказан, а впоследствии и подтвержден самим «составителем» статьи.

Конечно, если необходимо во что бы то ни стало определить наличие заимствований, можно выполнить это и вручную. Но что делать, если приходится регулярно оценивать потоки материалов, например рефераты целого курса? В этом случае неплохо иметь под рукой инструмент, хотя бы частично решающий такую задачу. К счастью, нужные средства уже есть. Из претендующих на полноту и серьезность можно назвать два — пока еще бесплатную интернет-систему «Антиплагиат» и довольно мощное профессиональное решение «ПлагиатИнформ» компании «СофтИнформ», рассчитанное на использование в вузах и стоящее немалых денег. Впрочем, с ознакомительной версией продукта можно бесплатно работать в течение 30 дней.

Есть и другие средства, в том числе и разработанные за рубежом. Но, увы, те из них, что доступны для ознакомления, некорректно работают с текстами на русском языке.

А теперь о том, как присланная статья проходила проверку с помощью упомянутых инструментов. Начнем с «Антиплагиата». Проверка файла показала, что текст оригинален на 81 %. Однако отчет несколько не совпал с ожидаемыми результатами — часть найденных с помощью «Яндекса» заимствований система определила, но фрагменты с сайтов нашего издательства посчитала оригинальными. Кроме того, в списке источников были указаны не те интернет-адреса, которые обнаружились при первой проверке. Но это понятно: в Интернете не так много документов представлено в одном экземпляре, почти все копируются с указанием авторских прав или без оного. А вот отсутствие ссылок на сайт «Открытых систем» можно объяснить тем, что «Антиплагиат», скорее всего, индексирует наиболее популярные источники плагиата, такие как многочисленные сайты рефератов. Ссылки на них и были приведены в отчете.

Конечно, система работает не идеально и позволяет лишь констатировать факт наличия неоригинальных материалов в тексте. Но не стоит забывать, что это всего лишь инструмент, а окончательное решение всегда принимает человек. В общем, если вы нашли в статье ссылки на заимствования, то можете решить для себя, что делать с этой работой.

Как и у любого регулирующего механизма, у «Антиплагиата» вскоре обнаружились противники и даже борцы с ним. В Сети появился сайт antiplagiatkiller.ru, предлагающий воспользоваться одноименной программой «АнтиплагиатКиллер». Суть ее работы проста. По мнению автора, обмануть систему проверки просто — достаточно лишь поменять местами слова в предложениях, одни слова удалить, а другие заменить синонимами. Само приложение анализирует исходный и измененный тексты и на основании сравнения выдает оценку — будут ли заимствования определены «Антиплагиатом» или же материал нуждается в дальнейших изменениях.

Что же, и мы воспользовались таким решением. Для этого из той же статьи выбрали несколько фрагментов, определенных системой как плагиат, провели в них необходимые изменения согласно советам «АнтиплагиатКиллера», а затем проверили оба документа системой «Антиплагиат». Выяснилось, что исходный документ оригинален на 92%, а измененный на 91%, т. е. никакого положительного эффекта мы не получили.

Если же важно не просто доказать факт заимствования текста, но и точно указать первоисточник, не стоит полагаться на «Антиплагиат». Как правило, такие подробности имеют значение тогда, когда речь идет, например, о дипломах или научных работах. Специально для вузов компания «СофтИнформ» разработала систему «ПлагиатИнформ», позволяющую определять плагиат в документах, основываясь на сложных поисковых механизмах и большой
базе данных.

Для работы с «ПлагиатИнформом» мы выбрали все определенные ранее источники плагиата и внесли их в базу данных, т. е. проиндексировали. Система нашла заимствования практически мгновенно, сообщив, что и файл с оригиналом текста, и файл с изменениями от «АнтиплагиатКиллера» являются плагиатом на 94%. Причем для каждого абзаца был указан аналогичный фрагмент в первоисточнике. Кстати, если вы работаете с собст-венной БД исходных документов, то, в отличие от поиска в Интернете, сомневаться в подлинности оригиналов вам не придется. Предоставленная нам ознакомительная версия, к сожалению, не содержала полной базы данных источников, создаваемой и пополняемой компанией «СофтИнформ», поэтому нам не удалось выяснить, насколько точно система может проводить поиск интернет-заимствований.

Кроме того, «ПлагиатИнформ» сразу же отсекает такие хитрости, как замена некоторых символов латиницей. Иногда авторы пытаются обмануть системы проверки, заменив в электронном варианте текста символы русского алфавита латинскими, имеющими такое же написание. Например, увидев в тексте символ «р», вы вряд ли разберетесь, что это за буква — русская «эр» или латинская «пе». А если система просто пословно или посимвольно сравнивает тексты, для нее эта разница будет заметна и она по-считает разными одинаковые слова в первоисточнике и проверяемом документе. Так вот, провести подобным образом «ПлагиатИнформ» не удастся. Кстати, обнаружить такую подмену можно и вручную. Если ваш текстовый редактор поддерживает режим проверки орфографии, то слова с латинскими символами будут выделены в тексте как ошибочно написанные или нераспознанные.

Но вернемся к «ПлагиатИнформу». К сожалению, эта система доступна далеко не каждому. Предназначена она, как уже говорилось, для высших учебных заведений и сейчас работает лишь в нескольких вузах Казахстана. Остается надеяться, что в скором времени этот инструмент станет доступен и российским преподавателям. А пока приходится полагаться лишь на сознательность студентов, школьников и начинающих авторов.

Конечно, можно настолько изменить документ (не затрагивая при этом его смысла), что удастся «обмануть» любую систему. Но будет ли тогда это считаться плагиатом? Скорее всего, нет. Если факт плагиата невозможно доказать, то, значит, либо работа написана самостоятельно, либо над ней изрядно потрудились.


Совет

Избавиться от ненужного форматирования при копировании данных из браузера в редактор можно следующим образом: скопировать текст с веб-страницы в буфер обмена, вставить в простой текстовый редактор (например, в «Блокнот»), затем еще раз скопировать в буфер и вставить в нужное место вашего документа.


Быстрый поиск плагиата
в рефератах

Если вам необходимо проверить, не переписан ли реферат из Интернета, можно воспользоваться услугами сайта 2balla.ru. Как видно из его названия, он был создан в помощь преподавателям и на беду нерадивым ученикам. Работает система очень просто — на сайте хранится постоянно пополняющаяся коллекция рефератов, взятых с различных сайтов, и с помощью поискового механизма «Яндекс» любой может проверить подозрительную работу на подлинность.


Система «Антиплагиат»

Зарегистрировавшись на сайте antiplagiat.ru, вы сможете проверять практически любые тексты на наличие в них заимствований. Система предлагает две возможности: быструю проверку текста объемом не более 5000 знаков и комплексный анализ файла, содержащего текст любой длины. Все истории проверок, а также краткие и полные отчеты о результатах анализа хранятся в «Личном кабинете пользователя». «Антиплагиат» имеет собственную базу источников, куда входят базы научных текстов и рефератов, а также информация с сайтов, находящихся в открытом доступе в Интернете. Загруженные документы тщательно фильтруются — вся ненужная информация (рекламные баннеры, новости, заголовки меню и проч.) отбрасывается, а непосредственное содержание индексируется и заносится в базу данных системы.

Результаты анализа пользовательских документов представляются в процентном выражении — система указывает процент заимствований и оригинальных фрагментов. Причем для каждого заимствования обязательно указывается его источник.

Минус системы в том, что найденный источник заимствования не всегда является оригиналом: как и многие тексты, опубликованные в Интернете, он сам может быть плагиатом. Но если перед вами стоит задача определить именно «чужие» фрагменты в документе, то с этим «Антиплагиат» справляется вполне удовлетворительно.


«ПлагиатИнформ»

Система «ПлагиатИнформ» позволяет проводить поиск заимст-вований в документе как по собственной базе данных, в которую входят документы из интернет-источников, так и по базе данных, создаваемой пользователем из имеющихся уникальных научных работ, дипломов, рефератов и т.д.

Поиск плагиата производится по индексированным документам, иначе называемым просто индексами. Сначала поиск ведется по индексу, при этом подозрительный документ целиком сравнивается со всеми файлами. Если факт плагиата не будет установлен, то начнется поиск по второму индексу, где все файлы разбиты на абзацы, и подозрительный документ также проверяется по каждому абзацу. Этот вид поиска медленнее первого, но позволяет гораздо точнее определить факт и степень плагиата. Зачастую в документе, не отнесенном к плагиату после проверки по первому индексу, определяются заимствования при поиске по абзацам, причем с достаточно высоким процентом содержания чужого текста.

Индекс поисковой системы - это своеобразный информационный массив, где хранятся специальным образом преобразованные текстовые составляющие всех проиндексированных файлов. Именно благодаря индексам и достигается высокая скорость поиска. Создание нескольких индексов в «ПлагиатИнформе» позволяет использовать различные параметры поиска плагиата для документов и осуществлять поиск отдельно по каждому индексу.