Поисковые системы |
![]() ![]() |
Wolfram alpha для Google Android/ 17:30 09.03.13Wolfram alpha своеобразная поисковая система в базе данных научных знаний и вычислительных алгоритмов. Основатель компании Wolfram Research, Стивен Вольфрам обосновал возможность перевода текстовых запросов на естественных языках в машинный язык и применил ее на практике в своей поисковой системе. Система разрабатывается уже четверть века. Стивен Вольфрам, создатель этой системы и языка программирования «Математика», на котором она написана, некогда занимался клеточными автоматами и издал книгу с многообещающим названием «Новый вид Знания», ставшую бестселлером и вызвавшую оживленные дискуссии в научной среде.
Сам интерфейс программы прост и представляет собой браузер, замороженный на одной странице и расширенную математическими символами клавиатуру. Разумеется, для использования требуется подключение к интернету.
Подлинная система Искусственного Интеллекта, подобна фантастическому компьютеру звездолета «Энтерпрайз» из сериала «Звездный путь». Кроме знания всего и обо всем, она еще обладает невероятными вычислительными возможностями. Не за горами и распознавание человеческой речи, пока осуществленное только на платформе iOS в рамках проекта Siri.
Общее руководство по оценке качества поиска от Google. Версия 1.0/ 17:36 09.03.13В начале марта 2013 года Google официально опубликовал версию 1.0 руководства для асессоров по оценке качества поиска. Документ насчитывает 43 страницы и является официальной сокращенной версией руководства, утвержденного в ноябре 2012 года. Любопытно, что ранее в интернет уже просачивалась версия 3.27 General Guidelines. Она была датирована 22 июня 2012 г. и содержала 161 страницу.
«Общее руководство по оценке качества поиска», прежде всего, предназначено для асессоров Google, работающих по всему миру, и оценивающих качество веб-страниц и поиска в целом. В документе приводится подробное изложение основных принципов, которыми должны руководствоваться асессоры Google в ходе своей работы. Руководство включает в себя инструкции по оценке качества поиска, кроме того, в нем рассматриваются подробные примеры оценки страниц, перечислены наиболее распространенные случаи сложностей, возникающих у асессоров при оценке сайта. Основное, что следует усвоить веб-мастерам из приведенного документа: асессоры оценивают не домен в целом, а каждую страницу сайта в отдельности, присваивая ей определенный рейтинг. Далее, исходя из общего рейтинга страниц, сайту присваивается их усреденный рейтинг. Кроме того, в настоящее время все поисковые запросы Google делит на: навигационные если пользователь осуществляет поиск конкретной веб-страницы по ссылке; информационные когда ищут информацию по определенной теме; и деловые когда пользователь ищет конкретный продукт или услугу. Также представители Google напоминают, что весь основной контент интернет-гигант делит на следующие категории: 1. Основной контент: новостные статьи, записи в блогах, информация о продуктах и услугах, видео, поисковые блоки или области для ввода логина и пароля при входе на сайт. 2. Дополнительный контент: элементы внутренней навигации, ссылки на похожие продукты или ссылки на видео. 3. Рекламный контент: рекламные объявления, ссылки на спонсоров, списки спонсоров и т.п. При этом, участники команды Google заявляют, что ни один из перечисленных типов контента не является доминирующим для поисковой системы. Это значит, что ни одному из типов контента автоматически не присваивается ни высокое, ни низкое качество. Также рейтинговая оценка не может быть выставлена только исходя из соответствия запросу. Асессоры обязаны выставлять оценки исключительно, исходя из качества контента опубликованного на странице.
Теперь рассмотрим документ Google подробнее:
Первая глава первой части Руководства посвящена оценке страниц сайтов в целом. В ней приводится руководство по работе с интерфейсом для асессоров, руководство по оценке URL, информация о безопасности в интернете, напоминания о том, каким критериям должны соответствовать асессоры Google. Во второй главе даются более подробные инструкции по изучению и рассмотрению поисковых запросов и оценке контента на предмет соответствия запросам пользователей. Приводится классификация запросов, рассматриваются проблемы многозначных, информационных, локальных, навигационных и других наиболее «проблемных» поисковых запросов.
Третья глава «Общего руководства по оценке качества поиска» посвящена работе асессоров с языковой классификацией главных страниц сайтов (Landing page). В главе 4 речь идет о присвоении страницам специальных категорий, исходя из их полезности для пользователей. На сегодняшний день в Google разработано 6 таких категорий: Vital, Useful, Relevant, Slightly Relevant, Off-Topic (Useless), Unratable. Расскажем о каждой категории подробнее: Категория Vital – присваивается страницам, когда поисковый запрос пользователя, связанный с ними, может быть многозначным. При этом одно из значений должно быть явно доминантным и превалировать над остальными. Запросы подобного рода часто задаются пользователями в отношении компаний, мест, продуктов, персон, организаций и т.п. К категории Useful может быть отнесена релевантная страница с большой вероятностью полезности для пользователей, перешедших на нее из результатов поиска по конкретным запросам. Категория Relevant – присваивается релевантным страницам, которые могут быть полезны для достаточно большого количества пользователей. Ее основное отличие от категории Useful заключается в том, что страница категории Relevant может быть несколько менее свежей или находиться на менее авторитетном ресурсе. Категория Slightly Relevant (буквально: слабо соответствующая страница) присваивается странице, которая в соответствии с косвенными признаками могла бы быть полезной большинству пользователей и напрямую не связана с поисковым запросом. При этом, все же такие страницы должны присутствовать в выдаче, поскольку отдельные пользователи могут найти на них информацию, соответствующую именно их потребностям. Категория Off-Topic (Useless) присваивается страницам, нерелевантным большинству поисковых запросов, а значит, и малополезным для пользователей страницам. Заключительная категория Категория Unratable присваивается страницам, в случаях, если их невозможно оценить. Данный статус присуждается страницам в двух случаях: если страница не загружается или если она при запросе на одном языке (к примеру, на французском) она загружается на другом (к примеру, на итальянском). Важно, что страницы на английском языке не считаются иностранными ни для каких запросов. Также в качестве иноязычных не рассматриваются страницы, содержащие изображение, понятное человеку, говорящему на любом языке; страницы со ссылкой для скачивания любого программного продукта; многоязычные страницы, если на них содержится большой объем информации на языке запроса. Отдельная инструкция посвящена невозможности загрузки страницы: так, если страница открывается в виде пустого бланка; содержит неработающие коды перенаправления (редиректы); выдает сообщение об ошибке или при ее открытии появляется уведомление о наличии вредоносной программы – асессор должен присвоить ей категорию Unratable. Глава 5 Руководства посвящена «общим проблемам ранжирования» и «содействию улучшению интернета в целом». В ней даются общие рекомендации асессорам относительно оценки релевантности страницы с точки зрения языка запроса, приводятся дополнительные примеры многозначных запросов. Приводятся примеры интерпретации запросов с точки зрения их соответствия информации, содержащейся на главных страницах различных компаний:
Здесь Google призывает асессров руководствоваться принципом максимальной полезности для пользователя той или иной страницы, а также обращать внимание на даты ее создания и последнего обновления. Более свежий контент следует расценивать как более полезный пользователю. В главе 6 рассматривается еще один тип меток – это метки, указывающие на спам, «сомнительное содержание» сайта или наличие вредоносных программ. В Google существует следующая классификация спам-меток: 1. Метка Not Spam устанавливается если страница полностью соответствует всем требованиям к публикации веб-страниц. 2. Метка Maybe Spam применяется если у асессора возникает подозрение в том, что страница является спамной. 3. Метка Spam должна использоваться асессором в том случае, если на странице замечены явные признаки спама. Еще одна разновидность меток порно-метки. Асессоры в обязательном порядке должны применять их, если страница содержит какие-либо признаки наличия порнографического содержания. Это могут быть изображения, тексты, видео, рекламные сообщения соответствующего характера. Важно отметить, что данная отметка может иметь региональный характер: так контент, не считающийся порнографическим в одной стране, может быть признан таковым в другой. Это связано с культурно-историческими особенностями отдельных стран. Классификация меток для порно-контента выглядит следующим образом: 1. Метка Clear Non-Porn Intent присваивается страницам, если пользователь попадает на них по обычным явно не порнографическим, запросам. Кроме того, такой контент автоматически признается Off-Topic (Useless). 2. Метка Possible Porn Intent присваиваются в случаях, когда запрос может иметь как порнографическую, так и не порнографическую интерпретацию. В качестве примера приводятся следующие англоязычные запросы: [girls], [gay], [thong], [breast], [sex], [spanking]. В Google их называют Possible Porn Inten (возможно, порнографические намерения). В таких случаях асессоры должны считать приоритетными непорнографические запросы и рассматривать страницы с «сомнительным содержанием» как порнографические. 3. Метка Clear Porn Intent присваивается откровенно порнографическим страницам, релевантным порно-запросам. Еще один тип меток касается зараженных страниц. К этому вопросу подходит следующим образом: даже если на странице есть качественный, свежий и релевантный контент, но она содержит вредоносное ПО, следы вируса или трояна – ее позиции в выдаче будут очень низкими. Исходя из этого правила, Google применяет метку «Malicious». Она присваивается страницам, если на них появляются незакрывающиеся всплывающие окна или, когда открытие страницы повлекло за собой попытку загрузки вредоносной программы. При этом важно знать, что если на странице появилось окно браузера с предупреждением о наличии вредоносного ПО, то статус «Malicious» ей не присваивается рейтинг Unratable невозможно загрузить страницу. Во второй части «Общего руководство по оценке качества поиска» приводятся разнообразные задания для асессоров и рассматриваются примеры их решения. В большинстве своем они направлены на оценку URL. Часть 3 посвящена аспектам ранжирования геозависимых и геонезависимых запросов. Здесь асессорам рекомендуется присваивать более высокие рейтинги как геозависимым, так и геонезависимым запросам, которые могут быть полезны пользователям. При этом, если пользователи ищут определенные места, адреса, объекты наивысшие позиции в результатах выдачи будут получать официальные сайты и страницы этих объектов. В свою очередь, страницы справочников и сайтов с упоминаниями адресов этих организаций будут ранжироваться хуже. Также Руководство советует асессорам придерживаться общего правила: если у специалиста возникает трудность с определением, является ли запрос геозависимым, то страницы, содержащие релевантную информацию нужно ранжировать как по геонезависимому запросу. В остальных частях Руководства рассматриваются вопросы рекламного контента и поискового спама. Здесь интернет-гигант советует асессорам опираться на рекомендации по обеспечению качества поиска, данные ранее веб-мастерам и разработчикам сайтов.
Google напоминает, что поисковая система строго наказывает за использование:
Вместо этого Google рекомендует веб-мастерам тщательно отслеживать все попытки взлома сайта и удаления его содержания. Оперативно удалять спам, созданный пользователями, и не допускать возможности его проникновения на ресурс. Говоря об отличии спам-страниц от качественных, представители гиганта поиска напоминают: если страница в полной мере соответствует критериям полезности для пользователей и содержит некоторое количество PPC-объявлений, она вполне может быть признана качественной. Асессорам следует оценивать, удовлетворяет ли страница требованиям полезности для пользователя. Иными словами, присутствует ли на ней:
Как видно из приведенного материала, руководство Google уделяет все более пристальное внимание работе над качеством собственной поисковой выдачи, привлекая к этому процессу не только огромный штат корпорации, но и асессоров со стороны. Еще одним доказательством данному утверждению является и то, что Google на днях рассказал своим пользователям о том, что происходит между нажатием кнопки «Поиск» и появлением страницы с результатами на специально созданном сайте «Как работает поиск». Перевод Анастасии Матвеевой
В Германии ввели «налог на Google»/ 21:24 02.03.13Согласно закону, все поисковые системы и новостные агрегаторы, собирающие и перепечатывающие новости, должны выплачивать авторам компенсацию Немецкие законодатели приняли закон, согласно которому все поисковые системы и новостные агрегаторы, собирающие и перепечатывающие новости, должны выплачивать авторам компенсацию, сообщает РБК. Отметим, что конкретные размеры компенсаций новый документ не предусматривает, также нет определенной системы их расчета, однако закон служит поводом для подачи исковых заявлении в суд. Когда законопроект находился на стадии обсуждения, корпорация Google выступила с резкой критикой такого нововведения, что стало поводом прозвать закон «налогом на Google». Как отмечают представители компании, подобные законы нарушают все принципы устройства Интернета и системы гиперссылок.
Интернет-пользователи получили возможность просматривать самые быстрорастущие поисковые запросы к Google за определенный день в семи новых странах, включая Россию/ 02.03.13Интернет-пользователи получили возможность просматривать самые быстрорастущие поисковые запросы к Google за определенный день в семи новых странах, включая Россию, пишет в корпоративном блоге представитель Google Цвика Хартман. В отличие от годового рейтинга запросов Google Zeitgeist, инструмент «Популярные запросы» сервиса Google Trends позволяет анализировать наиболее интересные для пользователей темы в определенный день. В основу сервиса заложен алгоритм выявления тем, интерес к которым растет быстрее всего за конкретный промежуток времени. Ежедневная статистика запросов теперь доступна, помимо России, для Австралии, Канады, Гонконга, Израиля, Тайваня и Великобритании. Ранее сервис уже позволял узнать, какие новости или события находятся на пике популярности в определенный период в США, Японии, Индии и Сингапуре. «Некоторые темы пользуются популярностью практически во всем мире — например, премия „Оскар“ или видео Harlem Shake, но большинство трендов актуальны только для отдельно взятых регионов. Чтобы изучить их, выберите нужную вам страну и при необходимости воспользуйтесь Переводчиком Google», — пишут разработчики. Google является второй по популярности поисковой системой в России, занимая около 26,5% рынка и уступая «Яндексу».
Во Франции создан интернет-поисковик, который может составить конкуренцию мировому гиганту Google/ 21:14 02.03.13Во Франции запущен интернет-поисковик отечественной разработки, который, как заявляют его создатели, имеет все шансы потеснить мирового гиганта американского происхождения Google. Как сообщили сегодня местные СМИ, его главными преимуществами стали возможность поиска информации в социальных сетях и удобная форма выдачи результатов. Поисковая система, получившая название Qwant, заработала в тестовом режиме на 15 языках, в том числе, на русском, и доступна пользователям 35 стран мира. Главная страница своим оформлением напоминает стартовые страницы популярных интернет-поисковиков, но после ввода запроса все результаты выдаются в оригинальном формате: картинки, видео, новости, предложения в интернет-магазинах и информация, найденная на прочих интернет-сайтах, публикуется на одной странице. Кроме того, в отличие от существующих поисковых систем, новый ресурс способен находить информацию в социальных сетях Facebook, Twitter и Google+, причем речь идет не только о сообщениях пользователей и размещенных ими фотографиях и видео, но и об оставленных к ним комментариях. «Мы хотели, чтобы на одной странице были показаны все возможные результаты, имеющие отношение к запросу пользователя», отметил один из создателей интернет ресурса, инвестор Жан-Манюэль Розан. По его словам, принцип работы французского поисковика больше соответствует новым реалиям Интернета и учитывает бурное развитие социальных сетей. Работа над созданием системы Qwant велась в течение двух лет французскими программистами и специалистами в области информационной безопасности. Стратегию развития интернет-ресурса на французском и международном рынке его создатели пока держат в тайне, известно лишь, что доходы проект будет получать от размещения рекламы, как и другие существующие сейчас интернет-поисковики. На данный момент на долю Google приходится 90 проц французского рынка интернет-поиска, остальные 10 проц делят между собой Bing, Yahoo, Ask Network и Orange Search.
Сделан анализ поисковых запросов на день Святого Валентина/ 01:59 18.02.13В поисковиках Яндекс и Google запросы «презент любимой на День Святого Валентина», «что преподнести девушке на 14 февраля», и различные варианты подобных вопросов, на 30 процентов популярнее таких же, но написанных девушками. То есть, мужчинам больше интересны подарки для женщин, нежели наоборот. Такая информация была предоставлена в исследовании проведенном «Ашманов и партнеры». «Презент для мужчины» данный запрос украинок интересует почти в 2 раза меньше «подарка любимому» и «презента для мужчины». А вот запрос «подарка для девушки или женщины» можно встретить почти в 18 раз чаще, нежели запрос «подарок для жены». Говорится только лишь о запросах, которые связаны с Днем Св. Валентина. В общем, популярность запросов, которые связаны с 14 февраля, снизилась. К примеру, на 2006 год приходится пик заинтересованности, а показатели текущего года почти в 2 раза ниже. Но количество запросов относительно презентов к данному празднику возросло. Если сравнивать с 2012 годом, то украинцы в этом году поисковые системы спрашивают на 10 процентов больше. «Ашманов и партнеры» провел исследование результатов поиска в Яндекс и Google. Были изучены только запросы украинцев, которые содержали словосочетания «День влюбленных» и «День Св. Валентина». Как было сообщено из Одессы, приблизительно 25% всех запросов одесситов на праздники было связано с поиском презентов, подарков. Пользователи желали отыскать хорошие идеи подарков, популярна была доска объявлений, задавали вопросы, как своими руками сделать подарок, разыскивали конкретные вещи, к примеру, варежки для влюбленных, футболки с надписями, кулон-сердце для влюбленных. Запросов о подарках мужчине, парню, мужу при этом было почти в десять раз больше, чем о подарках девушкам. Также одесситам было интересно, проведение каких торжеств планируется в различного рода заведениях – к примеру, в зоопарке или в оперном театре.
Поисковик в iOS обходится Google в 1 млрд долларов/ 02:18 18.02.13Тот факт, что Google является поисковой системой по умолчанию в операционной системе iOS, выгоден обеим сторонам: Google получает мощную рекламу и прибыль, а Apple немаленькое вознаграждение. По данным аналитика Скотта Девитта (Scott Devitt) из Morgan Stanley ежегодно Google выплачивает оппоненту около 1 млрд долларов за использование своего поисковика в качестве основного в iPhone, iPad и iPod touch. Около года назад аналитики Macquarie также насчитали 1 млрд долларов, который Google платит Apple за использование ее поисковика по умолчанию в браузере Safari. Тогда сообщалось, что компания Ларри Пейджа (Lary Page) зарабатывает на этом соглашении 300 млн долларов. В 2010 году проходила информация, что Apple получает 75 центов с каждого доллара, заработанного Google на продаже поисковой рекламы в iOS. Девитт считает, что подобную схему разделения доходов не приветствует Apple, поскольку она слишком сложна. Стоит отметить, что Google часто платит другим компаниям за то, чтобы те использовали ее поисковую систему по умолчанию. В частности, Mozilla имеет с этого доход в размере 300 млн долларов, подсчитал аналитик Morgan Stanley. В I квартале 2012-2013 финансового года (завершился 29 декабря 2012 года) чистая прибыль Apple составила 13,06 млрд долларов, аналогичный показатель у Google оказался равным 2,89 млрд долларов.
Yahoo! будет показывать контекстную рекламу Google/ 04:05 10.02.13
Молодежь тупеет из-за интернета?/ 03:54 10.02.13 Как только интернет активно влился в нашу жизнь, все чаще стали звучать обвинения в его сторону.Если собрать коллекцию обвинений против Яндекс, mail.ru, Google, Yahoo, то не хватит и страницы. Вот лишь несколько наиболее интересных. Поисковые системы обвиняли в: Поводов «обидеть» эти системы набралось множество: от банальных – до самых серьезных. Однако самым оригинальным поводом стала статья в СМИ snob.ru, которая посвящена тому, что Google якобы отупляет молодежь.«Биржевой лидер» разбирался, насколько серьезны доводы этой статьи. Как Google отупляет молодежьПроект «Сноб» приводит несколько причин «отуплению» молодежи. 1) Молодежь не старается ничего запомнить, ведь все можно найти в сети. Это доказывает эксперимент, который был проведен на 60 студентах. Их попросили набратьна компьютере небольшой список. Интересно, что первую половину студентов предупредили, что файл будет позже сохранен, а второй сказали, что файл удалят. Так вот, те, кто думал, что файл удалят, запомнили информацию намного лучше. 2) Поколение практически разучилось писать от руки. Молодые люди постоянно что-то печатают, а если их просят что-то написать от руки, это доставляет им большой дискомфорт. Опять же был проведен эксперимент. Студентов попросили сделать пересказ небольшого отрывка. Первой группе студентов нужно было предварительно написать этот отрывок от руки на бумаге, а вторую группу попросили набрать текст на компьютере. Как вы думаете, кто справился с заданием лучше? Кажется, ответ очевиден. 3) Работа в сети, с компьютером освобождает нас от запоминания ненужных вещей. Однако snob.ru опровергает это. Интернет не способствует развитию креатива. Автор проекта «Сноб» опирается на статью из Scientific American, в которой говорится, что клетки, которые не заняты непосредственно запоминанием, все равно не будут потрачены на решение неординарных задач. Нашу память нужно специально напрягать и занимать, что получить результат. Вот пример: в гипокампе ученые обнаружили нейроны, который активизируется, например, на упоминание о Дженифер Энистон. Интересно то, что из огромного количества таких нейронов, только несколько будут хранить всю информацию о ней, а все остальные будут просто вызыватьв памяти фото, моменты из фильмов, но не больше. И даже если вы освободите еще свободное место, все равно вы лишь дадите место этим простым ни к чему непригодным нейронам. Эксперты журнала, блогеры и представители социальной сети «Одноклассники.ру» также порассуждали на эту тему. На самом деле, эту проблему «опутепния молодежи», когда-то давно поднимал еще Тургенев в романе «Отцы и дети».Дети никогда не будут похожи на родителей, в том смысле, что всё развивается. Если бы наши дети, то может быть и не было бы даже Googleи Яндекс.
Яндекс занял четвертое место в мировом рейтинге поисковиков/ 15:36 08.02.13Рейтинг был составлен специалистами аналитической службы comScore. Согласно обзору указанной компании, по итогам 2012 года российский поисковый ресурс Яндекс стал четвертым в мире в рейтинге поисковиков, обогнав аналогичный веб-ресурс, принадлежащий корпорации Microsoft, по числу обработанных поисковых запросов. В частности, за декабрь 2012 года российская поисковая система обработала свыше 4,8 миллиардов запросов, тогда как ресурсы Microsoft обработали менее 4,5 миллиардов запросов. Первые три места в упомянутом рейтинге заняли Google, Baidu и Yahoo. При этом лидер рейтинга за минувший год обработал порядка 115 миллиардов поисковых запросов.
|
Март
Memories
настройка:ссылки в новом окне показывать аватаров √ ширина колонки: << туда | х | сюда >>
e-mail: skilfully@skilfully.org
=?>
|
[^] Все о поисковых системах. | [ page generation time - 0.026 ] |