Друзья, доброго понедельника!
Поисковики нас приучили к мысли, что на сайте лучше всего размещать уникальные тексты. В большинстве случаев именно так и есть. Мне, по крайне мере, не встречалась ситуация, когда в топе сидят хотя бы 3 сайта по одинаковой статье. Но что означает фраза «уникальный текст»?
С позиции пользователя, уникальной является статья, не встречающаяся в поисковой выдаче. Следовательно, если текст проверяется с помощью одной из программ-антиплагиаторов и получаемый результат — 100%, статья уникальна.
Это может быть авторский текст, купленный на одной из бирж или написанный только что. Но это так же может быть и текст с ресурса, на котором запрещена индексация. Одним из таких ресурсов является Вебархив — крупнейший портал, постоянно делающий «слепки» сайтов. Файл robots.txt запрещает индексацию всех этих страниц.
А теперь самое интересное. Представьте, что хозяину сайта надоело заниматься написанием статей, публикацией, да и вообще развитием ресурса. Следствием подобного является неоплата домена и/или хостинга, после чего сайт перестаёт существовать и через некоторое время выбрасывается из индекса.
Изюминка в том, что Вебархив продолжает хранить старые слепки. Стало быть, можно взять информацию из него и использовать на своих сайтах. Удобно? Очень, это же залежи ценного контента, причём, совершенно бесплатного.
Вебмастера давно разведали этот способ. Даже были (может, и сейчас есть) сервисы, специализирующие на извлечении содержимого архивных страниц или продаже «захороненных» текстов.
И тут возникает вопрос: как относятся поисковые системы к подобных текстам? В общем случае, нормально. Если текст стоящий, то на него и трафик будет, и комментарии посетителей. Но будет ли подобная статья уникальной?
Здесь уместно вспомнить сервис Яндекса «Оригинальные тексты». Чувствуете подвох? Не уникальные, а именно оригинальные?
Засланный в поддержку Яндекс вопрос: «Будет ли статья с сайта, прекратившего своё существование и выпавшая из индекса, а затем добавленная на новый сайт, уникальной?» даже удостоился ответа. Точной цитаты не сохранилось, но общий посыл такой: «Да, подобные тексты являются уникальными, но не оригинальными».
Что это значит? Бот индексирует статью, и если в своей базе не находит дублей, считает подобный текст оригинальным. Далее страница может выпасть из индекса, а потом войти снова, но её старое содержимое оригинальным уже не будет, а будет просто уникальным.
Иными словами: оригинальный текст всегда является уникальным, при этом узнать, является ли статья таковой, не представляется возможным.
Сервис «Оригинальные тексты», судя по всему, только осуществляет привязку к конкретному пользователю. Ещё забавнее, что можно с другого аккаунта добавить ту же статью. Теперь вспомним фразу сервиса: «попробуем использовать это в настройке поисковых алгоритмов». Чуете иронию?
днём интернета
шоколадкой для работы мозга
коробочкой ароматного чая для бодрости
продлением хостинга на +1 месяц
О, продолжение темы? )) И спасибо огромное за «трафик будет», Андрей!
По теме сайтов на текстах, вытащенных из Вебархива, добавлю, что тут результат непредсказуем. В течение года создавал 4 сайта на уникальных статьях с ушедших в небытие ресурсов. Результат был нулевой. Теперь понимаю, что помимо уникальности и оригинальности, для статьи важна еще и актуальность. Ну и наличие в ней ключей, разумеется ) Сейчас не вижу смысла создавать сайты исключительно на текстах из Вебархива, без разбавления заказным рерайтом/копирайтом. Видимо, именно оригинальные тексты дают толчок к развитию — другого объяснения пока нет.
Насчет инструмента «Оригинальные тексты» от Яндекса вспомнилось, как возмущало достаточно долгое несправедливое отношение к вебмастерам-новичкам, не имевшим возможности добавить текст, пока ТИЦ у сайта меньше десятки. Сейчас такого ограничения нет, это уже прогресс ) Но все равно, тексты из Вебархива, даже уникальные, я бы не стал добавлять в Вебмастер.
Константин, доброго дня!
Ты прав, как-то у меня очень оптимистично получилось. Траф скорее всего будет, так правильнее. Рассчитывать на тысячи уников ежедневно с одного Вебархива вряд ли приходится. Рассуждаем с точки зрения бывшего владельца: если сайт имеет более тысячи посетителей, его уж всяко можно продать, даже напрячься разок и сгонять к нотариусу, подчеркнуть письмо на передачу.
Про десятку тоже помню) И люди возмущались, что под удар попадают, в первую очередь, новые сайты, с которых можно было невозбранно тырить контент.
Андрей, под «трафик будет» разглядел линк, вот за это и спасибо )
Константин, хорошему человеку с хорошими статьями же
Доброе время суток, Анди и читатели его блога!
Читая статью подумал, что Вебархив это что-то вроде вторсырья или секон-хэнда. Что-то можно надыбать бесплатно и наверняка есть те, кто за денюжку малую потрошат архив и раскладывают статьи подобно старым шмоткам на раскладушках…
Этакая «вкусная» мусорка на задворках интернета
Денис, доброго дня!
На самом деле это Архив Интернета
Почти как фотоальбом. Интересно иногда посмотреть, как раньше выглядели сайты.
А контент как бы побочный эффект
Так и есть, многие продают статьи из Вебархива на контентных биржах.
Никогда не задумывалась об «оригинальности») Интересные наблюдения, Andy! А вот стоит ли использовать статьи из вебархива, думаю не стоит. Если материалы попали в утиль, то потому что не столь уж и хороши. Иначе владельцу было бы выгодно оплачивать хостинг. Ну мне так думается…
Надежда, траф статьи дать могут. Но ожидать хотя бы по тысячи с каждой вряд ли приходится. Так что да, согласен, будь всё настолько радужно, бывший владелец не бросил бы сайт. Но встречаются же «брошенки» с сотнями уников. Для старта не так и плохо 1-2 сотню хостов заполучить)
Интересные наблюдения, а вот для тех, кто делает пачки сайтами и потом ставит на них Сапу или например, торгует в ГГЛ, то такой контент вполне бы пригодился. Бесплатно и вовсе не жалко денег, если сайт уйдет в Минусинск.
Хорошие наблюдения — спасибо. Про оригинальные тексты также не задумывалась, просто добавляла в панель Яндекса и все, дабы подтвердить права.
Елена, в ГГЛ требуют очень хорошие поведенческие. Попасть туда не так-то просто нынче.
Константин, это тоже удивляет. ГГЛ уже не те, но до сих пор не хотят пересмотреть приём сайтов. Прошли времена, когда фраза «сайт принят в ггл» автоматически +10к минимум к стоимости накидывала.
Елена, для сапы подойдут, тут даже спорить не о чем. К сожалению, былыми заработками в ней вряд ли кто может похвастаться. Но что-то получается всё же)
Траф и ручками написанные статьи могут не дать — даже 10 переходов в месяц. Поэтому почему бы полезную статью оттуда и не разместить? Про Вебархив знал, но пользовался однажды, когда Зоин первый КУК слетел и статьи оттуда вытаскивали. А так да, можно продажей заняться статеек
Кстати, неуникальные статьи тоже в топах могут быть и давать трафик, главное заголовок и подзаголовки нужные прописать
Дима, доброго дня!
Верно, могут не дать. Но порой люди ведут блог исключительно для себя, эдакий личный онлайн-дневник)
Размещать свои статьи — это понятно. Какой при этом смысл в размещении чужих? Начнут появляться такие статьи на старом блоге без посещаемости, а толк будет разве только при продаже ссылок в биржах. Вообще, это довольно печальная ситуация: на сайте тысячи статей, а трафа — несколько десятков.
Про неуник в топе — это да. Копипаста рулит) Новички при оформлении могут вообще не пользоваться тегами, а некоторые темы порой заголовок статьи пихают в h2. В самом тексте же можно встретить что-то вроде: <p style="e;font-size:25px"e;>
Бери статью, правильно оформи, и она уже выше оригинала в выдаче.
Интересная эта штука вебархив. А я о нем вообще ни сном ни духом.
Вот как мне все это думается. Ведь не обязательно брать целиком весь текст и копировать его. Можно же подредактировать, что-то добавить, что-то убрать, где-то своими словами переписать. В общем, не тупо копировать материал из вебархива, а использовать его как источник идей.
Дмитрий, здравствуйте!
Как вариант, можно рерайтить/дорабатывать и вебархивные статьи. Всё дело в целях и средствах.
Мне, скорее всего, было бы проще из топа брать, нежели рыть вебархив, выцеплять хорошие статьи, внедрять в них ключи. Но все люди разные)
Первый раз слышу про вебархив, думал если сайт не работает то все что было на нем исчезает
Олег, здравствуйте! Рад приветствовать Вас на этом скромном сайте
В том и проблема интернета, что информацию в паблик выбросить легко, а «потерять» — очень и очень сложно.
С первым официальным днём зимы всех! TEXT.RU фиксирует уникальность, имея ввиду данное сочинение на вольную тему. И даже значок можно у себя на ресурсе разместить. Код прилагается. А Яша фиксирует оригинальность, подразумевая первоисточник, т.е. ресурс, на котором этот текст впервые появился в свет.
Я так понимаю!
Наталья, спасибо! Пришла зима, скоро Новый Год, с чем и поздравляю
Антиплагиаторы оперируют выдачей и шинглами. Берут, допустим, 5 подряд следующих слов из текста, ищут по ним, потом ещё 5, снова ищут и т. д. Если не нашли ничего — текст уникальный.
У поисковиков же есть две базы: общественная (выдача) и внутренняя (где может храниться всё, когда либо проиндексированное). Да и шинглами они вряд ли пользуются, накладно.
Андрей, а на пальцах можно? Специально для участников Куликовской битвы.
Пошла смотреть, что такое ШИНГЛЫ!
Наталья, это канонизированные (приведённые к формату, учитываемых поисковой системой) куски текста, проверяемые в выдаче на соответствие.
Встречал статьи, где оптимизаторы высмеивают шинглы. И даже выкладки приводят, почему ПС сами не используют именно их.
Моё мнение: механизм довольно накладен, чтобы использовать его. Но суть-то в том, что пользователю поисковой системы более ничего не доступно. Поэтому — шинглы.
Спасибо, Андрей! Я уже почитала и ещё больше запуталась. Но не думаю, что это смертельно. просто не лезла так глубоко.
Проясни кроманьонцу, почему никто не использует ссылки уникальности, которые любезно раздаёт Текст.ру?
Наталья, про какие «ссылки уникальности» речь? Это про возможность поделиться ссылочкой на результат проверки? В таком случае, подобное делает возможность просмотреть текст кому угодно, включая поисковики. А запрет индексации не означает, что ПСы даже не зайдут на страницу. И зайдут, и загрузят содержимое, и текст просканируются. Разве что в выдачу добавить не должны)
Интересная тема статьи, новая. Оригинальные и уникальные тексты…
Я об этом не задумывалась. Со старого удалённого блога разместила в теперешний несколько статей – и все дела: своё же. Проверила по названиям в Яндексе и Гугле — тишина, и решила, что можно смело ставить на своём другом блоге. А вот о том, что мои тексты еще и хранятся где-то, в голову не пришло.
Мне кажется, просто брать из архива и нести в свой блог чужие статьи можно только с согласия автора. И за его подписью, конечно. Иначе это – плагиат.
Светлана, доброго утра!
Можно и с другой стороны посмотреть: автор сам отказался от текстов, позволив им кануть в небытие.
Отчасти можно сравнить с произведениями Толстого: он же нынешним издательствам или киношникам не давал своего согласия на публикацию.
Андрюша, «автор отказался» — это вряд ли. У автора на компьютере сохранились тексты, я уверена. Мало кто отказывается от того, что пишет — тут уж я тебе могу сказать как человек, который работает с такими людьми непосредственно. Чаще авторы дрожат над каждой строкой, как Кощей над златом.
Толстого — уже нет. По Закону об авторском праве, есть определенные сроки после смерти автора, когда уже можно использовать произведения без разрешения автора (по памяти не назову их, забыла).
Пока автор жив, или есть его потомки — они могут законно признать свои права. И требовать компенсации. Так что я бы с такими текстами из архивов была поосторожнее.
Светлана, приветствую!
А как это могут узнать остальные? Связаться с автором на 99% не представляется возможным, текста нигде нет, стало быть, и не нужен. Найденные на улице деньги подбираем же, а не начинаем выяснять, чьё, крича на весь район «кто потерял»?
С авторством всё сложнее. Как доказать, что автор — ты? Разворошить всю цепочку может побудить лишь суд. А это немало: получить от регистратора документ, подтверждающий, что ты владелец домена в определённом временном промежутке, если копий в вебархиве не сохранилось, то получить документ от поисковых систем, подтверждающих, что в тот момент были проиндексированы указанные статьи с указанного сайта. Плюс, неизвестно как и кем всё должно заверяться. Теперь представим, что домен и/или хостинг забугорные, и всё усложниться ещё больше.
Поэтому лучший способ сохранить авторство — не выкладывать статей в Сеть
С произведениями, кстати, тоже не думаю, что всё просто. Пока текст не вызвал заинтересованность издательства, уповать остаётся лишь на ресурсы, на которых он размещается.
Лукьяненко и Перумов за права борются потому, что за ними кто-то есть. Будь это обычные авторы, выкладывающие произведения в интернет, и кто бы их слушал?
«Как доказать, что автор — ты?» А ты уверен, Андрюша, что статьи печатались только в интернете? А не, например, в какой-нибудь местной газете или журнале? Автор вполне мог позаботиться и здесь — в Адсенс (так, кажется, ресурс называется), например, забросить.
Я, например, так поступаю со многими своими текстами.
Недавно стихотворение свое нашла — переделанное, на какой-то платформе. Зарегистрировалась. Высказала то, что думаю, процитировала свое стихотворение, показала, что оно было опубликовано в одной из соцсетей — да-авно.
Девочка поняла, убрала свое. Вообще аккаунт убрала. Стыдно, наверное. Совесть — лучший контролер, я понимаю…
Кто такие Лукьяненко и Перумов — не знаю, сейчас загляну. Но знаю, что если кто-то поставит за цель — доказать авторство, то докажет (если , конечно, позаботился об этом). Закон будет на стороне автора. А если кто-то захочет на этом еще и заработать — то точно докажет и заработает. Обычно такие люди не забывают позаботиться о своих «нетленках».
Я все же за честное использование чужих работ. Хотя бы имена ставить — с благодарностью. Или рерайтить — но не копировать тупо текст, над которым кто-то работал.
Кстати, а вот идеи — копировать можно. Закон разрешает.
Светлана, если есть кому юридически представить автора, проблемы с удалением «спорного» контента вряд ли будут. Если нет — опять же, надо доказать, что это твои работы. В остальном — добрая воля хостера. Захочет его сотрудник помочь — отпишет клиенту и заблокирует, если тот ерепениться начнёт. Но хостер вполне может и направить по (не)известному направлению. Как и представители поисковых систем. Что тогда?
С девочкой повезло, совестливая попалась. А могла бы уйти в глухой игнор.
По сути, у вебмастера не так много рычагов давления, и все через какие-то сервисы: поисковики, хостер, регистратор. И всё. Если письмо владельцу сайта не получило отклика, а остальные твоими рассуждениями не удовлетворились, остаётся идти в суд.
Лукьяненко и Перумов всего лишь топовые авторы. Первый — фантаст, второй — фэнтезист
На стороне настоящего автора будет не закон скорее, а судья. Но у судей рутины много, вникать во всё желанием не горят. В результате и возникают бредни, когда сайт avto можно отсудить.
Подведём итоги) Если хочешь, чтобы авторство оставалось за тобой и это можно было относительно просто доказать, единожды выложенные статьи всегда должны быть доступны к просмотру с твоего домена. В противном случае, как в транспорте: за оставленное без присмотра никто ответственности не несёт.
Ну, наши статьи, думаю, будут доступны….
Ну, чтобы и наши статьи доступны, и у контентотыров совесть проснулась
И еще, тексты, выложенные в блог, могли читать люди — живые свидетели. И ворошить интернет не понадобится…
Кстати,хозяина найденных где-то денег тоже можно поискать. Не всегда, но иногда — есть такая возможность. И вернуть. Иначе себе дороже будет.
Светлана, как доказать, что эти живые люди действительно не знают тебя, но знают, что ты — автор?
Хозяина поискать можно, но только если это кошелёк или барсетка. Да и там могут сказать, что было больше и пригрозить полицией. Искать хозяина бывшего сайта ещё сложнее. Не все знают про хуизы, что уж говорить про что-то большее.
Я тоже не знала про такие архивы… спасибо, что просвятил… а то тут на днях знакомая рассказывала историю, как её статьи с «заброшенного» и удалённого ею с хостинга сайта, вдруг сказочном образом появились у нового владельца домена — вот, оказывается, откуда «ноги растут», а она грешным делом грешила на хостинг…
Елена, приветствую!
Сначала какое-то время поисковики хранят. Вебархив дольше) Можете, через него, или знакомая обнаружила уже после. Хостингу смысла нет подобным заниматься. Статьи с нелёвых сайтов вряд ли кто покупать будет.
Первый раз слышу про вебархив =/ Думаю, если узнала бы о нем раньше, то сто процентов начала бы копаться там)) но сейчас немного другое отношение к контенту, хочется всё-таки своё) А как сказал выше Пессимист, это что-то вроде секонд-хенда…… Я за новье!) Но кому-то наверно выгодно вылавливать бесхозный материал)
Александра, здравствуйте! Рад первым приветствовать Вас на сайте.
Сравнение с секондом не совсем корректное — платить-то за статьи не приходится. С другой стороны, как бы и не воровство, автор сам забросил их.
Новые, конечно, лучше, кто же спорит? Но тут дилемма возникает: или писа́ть самостоятельно, или заказывать за деньги. Если первый и второй способ не подходят, обычно приходят к самому простому — копипаст. А там опять логика: что лучше, текст, расположенный на пачке сайтов, или выпавший из индекса?
Вот таким нехитрым способом и можно разжиться контентом.
Ну это как сказать… По-моему только в нашей стране его умудряются продавать
Как человек этой страны говорю: дико, когда старенькое на развес продают
Привет, Андрей.
Просвети, пожалуйста.
Был у меня кулинарный блог. Продал в марте 2013. Посещаемость нормальная была… 1 к имел, а в под новый год и все 4 было.
Потом после продажи еще год блог висел мертвым грузом и только мозолил мне глаза. За все все это время был только один новый пост.
Потом всё. Пропал.
Вот скажи, так по совести, можно ли завести новый блог и закинуть туда все мои старые статьи. Мои, да уже не мои!
Юрий, приветствую!
С юридической точки зрения не подскажу. По факту — это использование контента, от которого отказался хозяин.
Грубый пример, который приводил ранее — найденные на улице деньги. Идёшь, смотришь — тысяча. Чья она? С брошенным сайтом, на мой взгляд, получается что-то подобное.
Вспомнилось просто. С доменами случаются казусы. Иногда люди на полном серьёзе (или придуриваются?) пишут: это мой бывший домен. Тут как бы всегда можно ткнуть в регламент, который предписывает ежегодную оплату. С «брошенками» подобного регламента нет.
В принципе, да. Когда я решил отказаться от блога, я его отдал за деньги. Новый хозяин решил по другому, бросил и всё!
Вот только странно, домен то держат! Только проверил. Окончание через 10 месяцев
Как вариант, сайт брали чисто из-за домена. Или просто домен перепродали, а новому владельцу сопутствующий сайт оказался не нужен. Только гадать остаётся)
Понятно, спасибо, Андрей.
Ну и ладно с доменом. Контент всё равно брошен. А я вот возьму и подниму!
Юрий, а и правильно