Поисковые системы

Login:  Pass:  
  keys | home | about | archive | keywords | read friends

Keyword: powerset


entries 1-7 from 7 total

Live Search будет оснащена приложениями на базе Powerset

   / 20.09.2008 03:00 20.09.08  

В скором времени специалисты компании Microsoft представят на суд пользователей ряд сервисов на базе Powerset.
В частности появится сервис Freebase – это электронная энциклопедия, функционирующая по типу Wikipedia. Пока она будет выпущена только в альфа-версии, однако будет предлагать самую разнообразную информацию. (http://www.freebase.com/)
Результаты поиска, предлагаемые поисковой системой, будут снабжены информацией из Wikipedia, что поможет пользователям быстрее сориентироваться.
И, наконец, в правой части страницы с результатами поиска будут находиться варианты, похожие на указанный запрос (related searches).
В настоящее время все эти сервисы проходят тестирование и уже в самое ближайшее время они станут доступны широкой публике.
 
 [ link ] keywords: windows live search, microsoft, powerset, wikipedia, новости, поиск, поисковые системы | [ add comment ]

Семантические поисковые системы устарели?

   / 14.09.2008 03:14 14.09.08  

Технически они должны превосходить другие поисковые механизмы, но семантические поисковики, возможно, были слишком медленны, чтобы использовать свой шанс, когда он у них был.

Сможет ли покупка компанией Microsoft семантического поисковика Powerset за 100 миллионов долларов произвести революцию в поиске, каким мы его сейчас знаем?
Если коротко, то нет.

Семантическая поисковая система пытается понять слова и предложения поискового запроса и страниц в Интернете. Она выявляет лингвистическую связь между различными частями предложения, чтобы понять его смысл. Другими словами, она читает.

Они объявлялись будущим поиска ещё до появления Google, но, к несчастью для них, это будущее было 5 лет назад.

Если семантические поисковые системы «читают», то основанные на ключевых словах поисковые системы «считают», используя статистические отношения для определения смысла. Этот подход используется в Google, и в теории этот метод хуже. Но так выходит, что хорошо настроенное сочетание множества статистических подсчётов очень хорошо работает.

Вместо того, чтобы пытаться узнать значение слова и к чему оно относится, знание того, как часто оно используется в сочетании с другими определёнными словами позволяет Google понимать контекст. Когда вы ищете «цыплёнок в масле», Google знает, что вы ищете блюдо, а не пачку масла или гуляющего цыплёнка.

Понимание отношений между словами и контекста – это то, что обещают семантические поисковые системы, но в этом и проблема. Google уже делает это очень хорошо в то время, как технология Powerset ещё даже не работает полностью. Powerset смогла ослепить некоторых специалистов своей тестовой платформой, которая большую часть времени выдаёт высококачественные релевантные результаты. Это конечно впечатляет, пока не осознаёшь, что поиск она производит только в Wikipedia и Freebase. Это хорошо структурированные, чётко определённые базы данных, написанные в формальном, стандартизированном стиле; даже обезьяна с Rolodex смогла бы извлечь высококачественные релевантные результаты из этих источников.

Если сравнивать поиск только в Wikipedia или Freebase, Google всё равно остаётся лучшим.

Согласно экспертам, функция Factz в Powerset выявляет недостатки этой семантической поисковой системы. Например, поиск «Beijing»(Пекин) показал 14 семантических связей. Это должны быть факты, касающиеся поискового запроса, которые поисковая система понимает. Но только два из них (Пекинские Олимпийские игры и Пекинские Параолимпийские игры) были действительно полезны.

Остальными были такие связи, как «Мероприятие, проходящее в Пекине» или «Население Пекина». Она также знает, что Билл Гейтс «основал Пола Ньюмена» и «сделал вице-президента». Большинство семантических связей, найденных Powerset, оказались мусором.

Другой важной чертой Powerset является то, что она производит естественный языковой поиск. То есть, она хочет, чтобы вместо «iPhone 3G price» (цена iPhone 3G) пользователь спрашивал «What is the price of a 3G iPhone?» (Сколько стоит iPhone 3G?). Это даёт семантической поисковой системе больше информации для работы, но также требует значительного изменения поведения пользователей.

Введение предложений возможно было естественным для пользователей в конце 90-х, но спустя 10 лет вряд ли найдётся пользователь, который испытывает трудности при составление поисковых запросов.

У семантического поиска есть потенциал, чтобы превзойти поиск по ключевым словам, и способность первого извлекать факты из страниц может сделать его в будущем более полезным.

Кроме того, он имеет возможность улучшить поиск компании Microsoft и нацеливание контекстной рекламы, дав Microsoft реальную возможность конкурировать с Google AdSense.

Возможно, Powerset и будет работать, как должна.

Выводы.

— Следите за рекламными решениями Microsoft, технология Powerset непременно будет встроена в этот сервис.

— Не позволяйте дурачить вас заявлениями, что семантический поиск – это будущее. Он был будущим с 90-х годов.

— Не беспокойтесь об оптимизации под семантические поисковые системы. Всё сильно изменится, прежде чем они начнут работать.

http://www.brandrepublic.asia/DigitalMedia/Analysisarticle/2008_09/Are-semantic-search-engines-pass/32601
 
 [ link ] keywords: microsoft, powerset, google, wikipedia, adsense, новости, поиск, поисковые системы | [ add comment ]

В поисках преемника Google

   / 08.09.2008 02:57 08.09.08  

Крупнейший в мире поисковик Google празднует десятилетие. Однако эксперты прогнозируют, что новые технологии могут лишить его лидирующей позиции. Семантические и агрегационные поисковики наступают на пятки гиганту и могут изменить способы работы в Интернете. Конкуренты, подобные Microsoft, также не оставляют попыток отыграть побольше пользователей и свалить Google.

Прошлогодняя статистика показывает, что Google ежемесячно обрабатывает около 37,1 млрд. поисковых запросов, Yahoo – 8,5 млрд. и Microsoft – 2,2 млрд. Google, получивший от Superbrands Council звание марки номер один, был создан 10 лет назад в Стэнфордском университете студентами Ларри Пейджем и Сергеем Брином. Они говорят, что их задача – «организовать мировую информацию и сделать её общедоступной и полезной».

Рут Мортимер, редактор журнала Brand Strategy, считает, что поддержка данной философии и зарабатывание при этом денег на рекламе было ключом к успеху. «Google любит говорить людям о том, что он бесплатный для всех источник информации, но в то же самое время он является рекламной платформой», — сказала она в интервью для Technofile. Но она верит, что агрегационные сайты, подобные Dogpile, которые работают с несколькими поисковыми системами одновременно, могут ослабить владычество Google. «Они могут быть очень полезны, поскольку поисковые системы по разному индексируют результаты», — сказала она.

Согласно Бену Кэмм-Джонсу, редактору новостей в журнале Web User, семантические поисковые системы, которые сосредоточены на значении поискового запроса, а не на ключевых словах, могут стать следующим большим шагом поисковых технологий. «Если есть что-то, что сможет превзойти Google, то это семантическая технология, но при условии, что это будет действительно хорошее предложение, и если нам удастся убедить людей, что Google – не единственный способ поиска информации в сети.»

Microsoft тоже инвестировала средства в эту область, купив семантический сайт Powerset. Она также сделала несколько изменений в Live Search. Нововведения включают возврат части цены покупки, если вы нашли и купили товар, используя их поисковик Farecast, который предсказывает, когда можно воспользоваться самыми дешёвыми услугами авиа-компаний и отелей. Также сделан акцент на видеопоиске.

«Google занял фантастическое положение, но с нашей точки зрения он это делает уже достаточно долго», — сказал Пол Стоддарт, старший менеджер по продукции Live Search. «Потребитель решит, чей поиск ему использовать».
 
 [ link ] keywords: google, microsoft, yahoo!, powerset, windows live search, новости, поиск, поисковые системы, реклама, статистика | [ add comment ]

Поисковые системы в поиске лучшего понимания

   / 25.08.2008 02:08 25.08.08  

Несмотря на то, что Google – 20-миллиардная компания, интернет-поиск всё ещё находится на начальной стадии развития, заявили вчера несколько специалистов, и, скорее всего, пройдут ещё годы, прежде чем пользователи смогут ввести вопрос в поисковой системе и получить именно то, что им нужно.

Рекламщики и продавцы, которые хотят, чтобы информация о них дошла до пользователей, надеются, что поисковая отрасль быстро решит эту проблему. Несколько тысяч человек из их числа собрались на конференции Search Engine Strategies в Сан-Хосе, чтобы подвергнуть мозговому штурму возникшие на этом пути препятствия.

«Что люди имеют в виду, когда вводят Олимпийские игры 2008?», спрашивает Шаши Сет, старший налоговый инспектор Cooliris, компании из Menlo Park, чьё программное обеспечение позволяет производить предварительный просмотр страниц, изображений и 3D видео, не нажимая на ссылки.

Определение значения запроса всё ещё остаётся искусством, сказал он, также он добавил, что по его мнению только 40% запросов понимаются системами верно.

Частично проблема заключена в том, что объём информации в Интернете быстро растёт. Многие поисковые системы экспериментируют с так называемым универсальным поиском, при котором выдаются результаты, сочетающие аудио, видео, карты, блоги и так далее в мешанину в надежде, что пользователи так смогут быстрее найти ответ на свой запрос.

Кроме того, небольшие поисковые системы придумывают новые системы поиска и организации данных с целью отдалить себя от Google, который, согласно Hitwise, в июле обработал 70 процентов всех поисковых запросов в США.

Yahoo открывает свои результаты поиска для публикации в сети с помощью Search Monkey, технологии, позволяющей людям управлять способом отображения информации о своём сайте.

Microsoft старается дать пользователям специфическую и полезную информацию – на запросы о Олимпийских играх например выводится таблица, показывающая страны, завоевавшие больше всего медалей.

Ask.com отображает область поиска на верху своей страницы и для неясных запросов типа «греческий алфавит» или «тригонометрия» будет выдавать изображения, потому что эти изображения интересны, сказал Эрик Кольер, вице президент Ask.com.

Но ещё предстоит сделать много работы. Пользователи не вводят хороших запросов, сказал Сет, большинство всё ещё состоит из пары слов. И это вызов – извлечь смысл из этих данных. Согласно исследованию BooRah, компании из Mountain View, ни одна из пяти основных поисковых систем — Google, Yahoo, Microsoft Live Search, Ask.com и Powerset (которую Microsoft приобрела в июле) не смогла ответить на вопрос «Каков размер населения в Японии?».

Когда слово «размер» было удалено, поисковые системы поняли запрос правильно, но «проблема в понимании», сказал Нагараджу Бандару, заместитель директора по технологиям в BooRah.

В отличие от других поисковых систем, BooRah не пытается проанализировать всё содержание Интернета. Она извлекает смысл из откликов о ресторанах, которые люди пишут в сети, разбирает их с учётом желания пользователя и создаёт результирующую рецензию, которая ранжирует рестораны по качествам, например по обстановке для свиданий. Мы надеемся расширить систему до отзывов об отелях, сказал Бандару.

Но даже для BooRah, мощности, необходимые для поиска – это вызов.

Google придётся построить «намного больше центров обработки данных», чтобы поддерживать будущие улучшения в поиске, сказала Джоанна Райт, глава производства, хотя компания не сообщит, сколько.

BooRah не возьмёт на себя такой риск, сказал Бандару. Компания будет арендовать серверы у Amazon, чтобы посмотреть, как будет работать её новый сервис по обработке отзывов об отелях.

http://www.sfgate.com/cgi-bin/article.cgi?f=/c/a/2008/08/18/BUC512D8V7.DTL&type=tech
 
 [ link ] keywords: google, yahoo!, microsoft, ask, windows live search, powerset, новости, поиск, поисковые системы | [ add comment ]

Поисковые системы: вопрос семантики

   / 18.08.2008 02:49 18.08.08  

Некоторые начинающие компании хотят, чтобы пользователи переосмыслили способ поиска информации в сети. И тяжеловесы это заметили.

В то время как тяжеловесы Microsoft Corp. и Yahoo Inc.тратят миллиарды, пытаясь отобрать у Google кусочек рынка интернет-поиска, растущие нишевые поисковые системы переосмысляют способ поиска информации, и привлекаю внимание большой тройки.

Разрабатывая инструменты, которые тщательно ищут истинный смысл слов на веб-страницах вместо того, чтобы просто предоставить список сайтов с совпадающими ключевыми словами, эти претенденты надеются создать сервисы, которые помогут пользователям быстрее находить то, что те ищут.

Это не значит, что эти молодые компании пытаются побить Google в его собственной игре. Не в этом дело, говорит Майкл Фрэнк, исполнительный директор Sprylogics International Inc. в Торонто, создателей Cluuz.com, семантической поисковой системы, пытающейся заставить пользователей переосмыслить способ поиска информации в сети.

«Потребители хотят находить информацию быстрее, и они ищут инструменты, которые помогли бы им сделать это», сказал мистер Фрэнк. «То, что мы делаем, уникально, и никто другой не может также.»

Такие поисковые системы, как Cluuz, используют семантическую науку, изучающую смысл слов, чтобы производить более релевантный поиск. Пока сайт, работет как самостоятельная поисковая система, но мог бы работать, превратившись в сервис Google, Yahoo или Microsoft's MSN, сказал Майкл Фрэнк.

В июле, Yahoo сообщило, что открывает данные своего индекса поиска для разработчиков, как часть проекта, который компания окрестила Build your Own Search Service (BOSS). В пресс-релизе, анонсирующем программу BOSS, Cluuz был одним из четырёх сервисов, которые Yahoo привела как пример инновационных инструментов поиска, использующих эту платформу.

Cluuz выросла из интеллектуального бизнес приложения, которое Sprylogics разработала для сбора и анализа данных на своих собственных серверах. Данная программа была особенно популярна у финансовых регуляторов, таких как Ontario Securities Commission, которая использует технологию Sprylogics для построения карт связей и деловых отношений между компаниями и частными лицами для своих расследований.

Чтобы создать коммерческую поисковую систему, Sprylogics просто взяли свою программу поиска и анализа и приспособили её для фильтрации индекса поиска Yahoo через приложение BOSS.

Выдавая результаты, которые содержат необходимую для пользователя информацию вместо того, чтобы просто искать ключевые слова на страницах, Cluuz и другие семантические системы верят, что смогут предоставить пользователям более релевантную рекламу, чем Google сейчас.

Если, для примера, кто-то ищет информацию об установке голубых фар на автомобиль, то обычная поисковая система на запрос «голубые фары» выдаст страницы, содержащие эти слова. Семантическая поисковая система, однако, может выдать страницы с результатами имеющими отношение к «световые приборы» или «рынок автомобильных запчастей», сказал Тим Ричардсон, профессор электронной коммерции и эксперт по поисковым технологиям из колледжа Seneca в Торонто.

Дело в том, что уровень контекста позволяет семантическим поисковым системам представлять информацию в соответствии с тем, как обычно думают люди.

Семантический поиск представляет интерес как для частных предпринимателей, так и для компаний тяжеловесов. В начале июля Microsoft выложило 100 миллионов долларов за Powerset, компанию из Сан-Франциско, которая разрабатывает семантическую поисковую систему для Wikipedia. Другие поставщики семантического поиска, такие как Hakia.com, которая накопила более 21 млн. долларов в венчурных фондах, также наращивают свою пользовательскую базу за счёт привлечения внимания большой тройки.

Мистер Фрэнк знает, что Google не беспокоит компания с рыночной капитализацией около 5 млн. канадских долларов, каковой является Cluuz, но он верит, что поисковая система, которую создала его команда, сможет выжить в одиночку или присоединившись к одной из лидирующих систем.

«Мы верим, что наша система является одной из трёх или четырёх лидирующих альтернативных поисковых систем на рынке», сказал Фрэнк. «Вы увидите, как всё большее число поисковых систем становятся частью других приложений, поэтому мы думаем, что это применение будет также востребовано, если вы ищете людей, компании или любые другие вещи.»

Пионеры семантического поиска, такие как AskJeeves.com от IAC/InterActiveCorp, переименованная в 2005г. в Ask.com, боролись за привлечение пользователей с середины 90-х годов и встретили множество препятствий на своём пути, основное из которых – стоимость.

Разработка программы, которая сможет проиндексировать громадные объёмы информации в Интернете, проанализировать её и быстро выдать релевантные результаты – это дорого и сложно.

В прошлом месяце, Cuil.Inc., компания, основанная бывшим сотрудником Google, представила новую поисковую систему, которая по заявлению, проиндексирует в три раза больше страниц, чем Google. Но система получила много критики от пользователей, которые говорили, что результаты часто были неточными и бесполезными.

Ключ к успеху семантического поиска в том, чтобы выдать результаты в контексте. Это сложно, так как объём информации всё возрастает, сказал Ричардсон.

«Причина, по которой люди хотят разрабатывать семантические поисковые системы, в том, что это более лучший способ нахождения информации», сказал он. «Учитывая, что объём контента растёт всё быстрее, поисковые системы должны быть более эффективны и работать по образцу того, как думают люди.»

Но так как более 2/3 всего поиска производится в Google, люди привыкли к такому способу работы. Успешной семантической поисковой системе понадобится очень быстро донести до пользователей информацию о работе своего сайта, считает Лесли Оуэнс, аналитик маркетинговой исследовательской фирмы Forrester Research Group.

«Некоторые люди считают, что образцы представления запросов были созданы Google`ом, поэтому они выражают свои вопросы не естественным языком, а всего в паре слов», сказала она. «Можно ли изменить этот образец, если бы люди смогли выражать поисковые запросы полными предложениями или вопросами? Нужно ответить на этот вопрос. Всё таки Google занял слишком большую долю рынка.»

Cluuz также показывает связи между различными документами и сайтами, основываясь не на ссылках, а на информации, содержащейся на страницах с помощью технологии под названием «графики семантических кластеров». Она отображает результаты в виде, который напоминает паучью паутину.


http://www.theglobeandmail.com/servlet/story/RTGAM.20080813.wrsearch14/BNStory/Technology/home
 
 [ link ] keywords: microsoft, yahoo!, google, msn, powerset, wikipedia, cluuz, ask | [ add comment ]

Microsoft заинтересовалась покупкой Powerset

   / 28.06.2008 04:48 28.06.08  

После того, как сорвалась сделка с Yahoo, Microsoft находится в поисках новых объектов для инвестирования средств. На сей раз стало известно о том, что софтверный гигант заинтересовался возможностью покупки поисковой системы Powerset. Особенностью этого поисковика является то, что он позволяет совершать запросы с использованием разговорных слов, поскольку при обработке ключевых слов учитывается их семантика. Microsoft готова предложить калифорнийской компании 100 миллионов долларов США (для сравнения напомним, что за Yahoo было предложено 44 миллиарда долларов США).
Компания Powerset была основана в 2005 году и в мае текущего года была запущена бета-версия «умной» поисковой системы.
Пока ни представители Powerset, ни представители Microsoft не дали никаких официальных комментариев по этому вопросу.
 
 [ link ] keywords: microsoft, yahoo!, powerset, новости, поиск, поисковые системы | [ add comment ]

У Google появляются новые конкуренты

   / 27.10.2006 02:56 27.10.06  

На сегодняшний день лидерство на рынке поисковых систем бесспорно принадлежит поисковой системе Google, однако в будущем ситуация может измениться. На рынке появляются новые поисковые системы, разработчики которых стремятся использовать эффективные технологии. В частности к выпуску готовится новая всемирная поисковая система Megaglobe.

Новость о её грядущем появлении появилась уже достаточно давно, однако пока её так никто и не видел. Что же касается разработчиков, то они по-прежнему сохраняют информацию о новой поисковой системе в большом секрете. Глава Megaglobe Наима Мур по-прежнему продолжает заявлять, что специалисты компании продолжают работу по созданию новой поисковой системы, однако конкретные сроки её выпуска названы не были. Вместе с тем, она подчеркнула, что Megaglobe сможет составить конкуренцию Google, поскольку там не только используются инновационные технологии, которые позволяет новой поисковой системе не только оказывать услуги очень высокого качества, но и эффективно бороться против намеренного увеличения количества посещений рекламных ссылок. Ожидается, что разработчикам, желающим разместить у себя на сайтах рекламные ссылки из Megaglobe, будут предлагаться отличные условия для сотрудничества.

Однако пока все обещания остаются голословными. Что ж, будем ждать появления этой поисковой системы на рынке. Кроме того, у Google может появиться и ещё один серьёзный конкурент – европейская поисковая система Quaero (что на латыни означает «я ищу»), инициатором по созданию которой выступил президент Франции Жак Ширак. Ожидается, что новая поисковая система будет пользоваться огромной популярностью у пользователей. К тому же по своим функциям она не будет уступать своим более именитым конкурентам. С помощью Quaero пользователи смогут осуществлять поиск не только текстовых документов, но и аудио и видеофайлов. Разработчики новой поисковой системы использовали особые технологии, благодаря которым будет обеспечиваться простой, быстрый, качественный и очень эффективный поиск информации. Новая поисковая система будет иметь множество языковых версий. Несмотря на то, что разработчики планировали представить проект этой поисковой системы ещё в марте этого года, пока она так и не выпущена, поэтому нам придется проявить ещё чуточку терпения. Что касается США, то американские специалисты также не остались в стороне, поскольку они занялись созданием новой поисковой системы Powerset, которая по их заявлению, должна затмить Google. Однако стоит ли воспринимать подобные заявления всерьез? Скорее всего, да, поскольку ожидается, что Powerset будет умной поисковой системой нового поколения, способной воспринимать человеческую речь. Возможно, что связи с появлением этой поисковой системы люди откажутся от использования ключевых слов. Также следует отметить, что в сети Интернет появилась новая многообещающая поисковая система SearchMash , которая пока находится в стадии тестирования. У новой поисковой системы имеется несколько интересных функций. Так, например, на правой части страницы с результатами поиска к соответствующему ключевому слову предлагаются картинки. Кроме того, пользователи могут указать необходимое количество результатов поиска, которые будут представлены на одной странице. Плюс ко всему пользователи могут перемещать результаты поиска с помощью простого их перетаскивания мышью.

Таким образом, несмотря на господство Google, разработчики не теряют надежду и продолжают предлагать на рынок всё новые и новые поисковые системы, которые вполне могут стать её серьёзными конкурентами.
 
 [ link ] keywords: google, новости, поисковые системы, megaglobe, quaero, powerset, searchmash | [ add comment ]