[Разработка веб-сайтов] Юристы из Гарварда обратили внимание на проблему «мертвых» ссылок в интернете
Автор
Сообщение
news_bot ®
Стаж: 6 лет 9 месяцев
Сообщений: 27286
Команда Гарвардской школы права изучила проблему «вымирания» ссылок и дрейфа контента в интернете. Исследователи проанализировали гиперссылки в статьях газеты New York Times начиная с запуска сайта NYT в 1996 году и до середины 2019 года. Исследование показало, что около четверти ссылок в статьях NYT нерабочие.В 2014 году Гарвардская школа права уже изучала «мертвые» ссылки. Тогда выяснилось, что почти половина всех гиперссылок в заключениях Верховного суда ведет к контенту, который либо изменился с момента публикации, либо исчез из интернета. В новом исследовании команда из Гарварда изучила более 550 тысяч публикаций NYT, содержавших 2,2 миллиона ссылок на внешние сайты. Из них 72% были глубокими — то есть вели на конкретный контент. Команда обнаружила, что около 25% ссылок в статьях NYT, которые раньше указывали на какой-то ресурс, теперь не работают. Эта проблема коснулась 53% статей, выходивших в NYT за последние 25 лет, при этом в материалах за 2018 год недоступными стали 6% ссылок, а за 1998-й — целых 72%.
Авторы исследования отмечают, что в некоторых разделах NYT процент «мертвых» URL-адресов намного выше. В разделе «Спорт», например, почти втрое больше неактивных ссылок, чем в разделе The Upshot. Эта разница в значительной степени связана со временем: средний возраст ссылки в The Upshot составляет 1450 дней, в разделе «Спорт» — 3196 дней.Чтобы определить, какие разделы страдают больше всех, команда разработала метрику Relative Rot Rate («Относительная скорость гниения», RRR). Из пятнадцати разделов в которых больше всего статей, у раздела «Здоровье» были самые низкие показатели RRR. Раздел «Путешествия» показал самый высокий уровень «вымирания»: более 17% ссылок в статьях этого раздела оказались битыми.Дрейф контента также является серьезной проблемой. Из-за этого явления ресурс по ссылке может расходиться со статьей. В качестве примера исследователи привели материал 2008 года о гонке в Конгресс со ссылкой на члена городского совета Нью-Йорка и на его страницу на сайте совета. Сегодня, щелкнув ту же ссылку, читатель перейдет на сайт действующего члена совета округа. Чтобы определить распространенность дрейфа контента, команда изучила 4500 неповрежденных URL-адресов. 13% ссылок из этой выборки значительно изменились с момента публикации; при этом ссылки из статей за 2009 год ведут на изменившиеся ресурсы в 25% случаев, в статьях за 2019 год — в 4% случаев.Как указывают авторы статьи, для предотвращения потери ресурса по ссылке можно использовать сервис The Wayback Machine, предоставленный Архивом Интернета. В этом случае при утере страницы ссылка откроет ее копию из архива. Кроме того, в 2013 году Гарвардская школа запустила проект Perma.cc, который позволяет создать архивную версию страницы со ссылкой на первоисточник.
===========
Источник:
habr.com
===========
Похожие новости:
- [Разработка веб-сайтов, JavaScript, ReactJS] 5 приемов по разделению «бандла» и «ленивой» загрузке компонентов в React (перевод)
- [Разработка веб-сайтов, API] Как написать удобный API — 10 рекомендаций
- [Разработка веб-сайтов, JavaScript, Программирование, GitHub, Игры и игровые приставки] Разработчик сделал Doom Captcha — теперь можно проходить тест на робота играя
- [Разработка веб-сайтов, Проектирование и рефакторинг, Хранение данных] Может поменять способ хранения?
- [Разработка веб-сайтов, Разработка мобильных приложений, Карьера в IT-индустрии] Без тимлида не обойтись, а что насчет техлида?
- [Веб-дизайн, Разработка веб-сайтов, CSS] Взгляд на Tailwind CSS (перевод)
- [Разработка веб-сайтов, HTML, ReactJS] Немного о том, как работает виртуальный DOM в React (перевод)
- [Разработка веб-сайтов, JavaScript, TypeScript] Практическое руководство по TypeScript для разработчиков (перевод)
- [Разработка веб-сайтов, CSS, Совершенный код] Трюки CSS, которые сделают из вас ниндзя верстки
- [Разработка веб-сайтов, Программирование, Haskell, Функциональное программирование] Создаем веб-приложение на Haskell с использованием Reflex. Часть 3
Теги для поиска: #_razrabotka_vebsajtov (Разработка веб-сайтов), #_giperssylki (гиперссылки), #_garvard (гарвард), #_new_york_times, #_razrabotka_vebsajtov (
Разработка веб-сайтов
)
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 18:07
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 6 лет 9 месяцев |
|
Команда Гарвардской школы права изучила проблему «вымирания» ссылок и дрейфа контента в интернете. Исследователи проанализировали гиперссылки в статьях газеты New York Times начиная с запуска сайта NYT в 1996 году и до середины 2019 года. Исследование показало, что около четверти ссылок в статьях NYT нерабочие.В 2014 году Гарвардская школа права уже изучала «мертвые» ссылки. Тогда выяснилось, что почти половина всех гиперссылок в заключениях Верховного суда ведет к контенту, который либо изменился с момента публикации, либо исчез из интернета. В новом исследовании команда из Гарварда изучила более 550 тысяч публикаций NYT, содержавших 2,2 миллиона ссылок на внешние сайты. Из них 72% были глубокими — то есть вели на конкретный контент. Команда обнаружила, что около 25% ссылок в статьях NYT, которые раньше указывали на какой-то ресурс, теперь не работают. Эта проблема коснулась 53% статей, выходивших в NYT за последние 25 лет, при этом в материалах за 2018 год недоступными стали 6% ссылок, а за 1998-й — целых 72%. Авторы исследования отмечают, что в некоторых разделах NYT процент «мертвых» URL-адресов намного выше. В разделе «Спорт», например, почти втрое больше неактивных ссылок, чем в разделе The Upshot. Эта разница в значительной степени связана со временем: средний возраст ссылки в The Upshot составляет 1450 дней, в разделе «Спорт» — 3196 дней.Чтобы определить, какие разделы страдают больше всех, команда разработала метрику Relative Rot Rate («Относительная скорость гниения», RRR). Из пятнадцати разделов в которых больше всего статей, у раздела «Здоровье» были самые низкие показатели RRR. Раздел «Путешествия» показал самый высокий уровень «вымирания»: более 17% ссылок в статьях этого раздела оказались битыми.Дрейф контента также является серьезной проблемой. Из-за этого явления ресурс по ссылке может расходиться со статьей. В качестве примера исследователи привели материал 2008 года о гонке в Конгресс со ссылкой на члена городского совета Нью-Йорка и на его страницу на сайте совета. Сегодня, щелкнув ту же ссылку, читатель перейдет на сайт действующего члена совета округа. Чтобы определить распространенность дрейфа контента, команда изучила 4500 неповрежденных URL-адресов. 13% ссылок из этой выборки значительно изменились с момента публикации; при этом ссылки из статей за 2009 год ведут на изменившиеся ресурсы в 25% случаев, в статьях за 2019 год — в 4% случаев.Как указывают авторы статьи, для предотвращения потери ресурса по ссылке можно использовать сервис The Wayback Machine, предоставленный Архивом Интернета. В этом случае при утере страницы ссылка откроет ее копию из архива. Кроме того, в 2013 году Гарвардская школа запустила проект Perma.cc, который позволяет создать архивную версию страницы со ссылкой на первоисточник. =========== Источник: habr.com =========== Похожие новости:
Разработка веб-сайтов ) |
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 18:07
Часовой пояс: UTC + 5