<?xml version="1.0" encoding="utf-8" ?>
<?xml-stylesheet href="http://rss.egloos.com/style/blog.xsl" type="text/xsl" media="screen"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/">
<channel>
	<title>웹 서비스 Insight</title>
	<link>http://joshuak74.egloos.com</link>
	<description>웹 서비스의 동향과 단상을 정리하는 블로그</description>
	<language>ko</language>
	<pubDate>Thu, 13 Apr 2006 15:13:12 GMT</pubDate>
	<generator>Egloos</generator>
	<image>
		<title>웹 서비스 Insight</title>
		<url>http://pds2.egloos.com/logo/1/200512/24/69/c0052869.jpg</url>
		<link>http://joshuak74.egloos.com</link>
		<width>80</width>
		<height>88</height>
		<description>웹 서비스의 동향과 단상을 정리하는 블로그</description>
	</image>
  	<item>
		<title><![CDATA[ Yahoo 코리아의 중의어 처리 ]]> </title>
		<link>http://joshuak74.egloos.com/1804173</link>
		<guid>http://joshuak74.egloos.com/1804173</guid>
		<description>
			<![CDATA[ 
  <br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds1.egloos.com/pds/1/200604/14/69/c0052869_0105636.jpg" width="500" height="119.447779112" onclick="Control.Modal.openDialog(this, event, 'http://pds1.egloos.com/pds/1/200604/14/69/c0052869_0105636.jpg');" /></div><br />
<br />
<p>&nbsp;</p><p>Yahoo 코리아에서 '비'를 치면 가수와 날씨 중에서 선택해서 검색하라는 결과가 상단에 나옵니다.</p><p>실제 검색해보면 가수 '비'는 '가수,앨범'등의 질의가 포함되어 확장해서 검색해주고 날씨 '비'는 기상,날씨와 같은 질의가 포함되서 검색됩니다.</p><p>이러한 질의어 확장을 '노가다'로 했는지 아니면 Clustering을 통해서 자동화했는지 궁금하네요.</p><p>여하튼 좋은 시도인 것 같네요.</p><br /><br />			 ]]> 
		</description>

		<comments>http://joshuak74.egloos.com/1804173#comments</comments>
		<pubDate>Thu, 13 Apr 2006 15:13:12 GMT</pubDate>
		<dc:creator>백호</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 사용자 평판 기반 리뷰 검색 서비스 Revu.co.kr ]]> </title>
		<link>http://joshuak74.egloos.com/1770228</link>
		<guid>http://joshuak74.egloos.com/1770228</guid>
		<description>
			<![CDATA[ 
  최근 Web 2.0 관련 컨퍼런스에 단골로 참여하시던 한상기님의 회사에서 무언가를 내놓으신다고 하더니,<br />
<br />
<a href="http://www.revu.co.kr/">Revu.co.kr</a>이라는 전문 검색 엔진을 릴리즈 하셨네요.<br />
<br />
Crawling 대상을 리뷰 글로만 제한하고,<br />
랭킹은 리뷰어의 평판에 따라 시행하고,<br />
기타 Tag로 검색하는 기능등이 있습니다.<br />
<br />
최근에 제가 관심을 가지고 있는 여행 관련 리뷰글을 검색해 보았는데 아직 검색 결과는 잘 나오는 것 같지는 않습니다.<br />
<br />
리뷰 문서만의 크롤링을 어떻게 했을까요? 노가다로 지정을 했을까요? 아니면 특정 키워드가 포함되면 자동으로 수집하도록 했을까요.(리뷰 문서들 중에서 자주 나오는 단어들을 통계적으로 추출해서?)<br />
<br />
사용자 평판을 어떤 식으로 구했을까요?<br />
<br />
훔훔 정말 궁금합니다.<br />
<br />
좋은 시도인 것 같습니다~~<br /><br />			 ]]> 
		</description>
		<category>검색</category>

		<comments>http://joshuak74.egloos.com/1770228#comments</comments>
		<pubDate>Sat, 08 Apr 2006 05:18:53 GMT</pubDate>
		<dc:creator>백호</dc:creator>
	</item>
	<item>
		<title><![CDATA[ RSS 피드 필터링 툴 FeedRinse ]]> </title>
		<link>http://joshuak74.egloos.com/1727544</link>
		<guid>http://joshuak74.egloos.com/1727544</guid>
		<description>
			<![CDATA[ 
  <a href="http://www.feedrinse.com/">http://www.feedrinse.com/</a><br />
<br />
재미있는 서비스 입니다.<br />
<br />
RSS Feeding 방식이 증가하면 결국 개인이 구독하는 컨텐츠의 양도 증가할테고 그러면 다시 과도한 정보의 이슈와 이를 잘 걸러내는 필요가 생겨날 것입니다.<br />
<br />
이러한 가려운 부분을 보고 만든 서비스인것 같아요.<br />
<br />
절차는 간단합니다. 위의 사이트를 통해서 Feed를 신청하고 키워드등을 통한 Filter설정을 통해 불필요한 Feed는 걸러내는 것입니다.<br />
<br />
단기간에는 크게 활성화되지는 않겠지만요...<br /><br />			 ]]> 
		</description>

		<comments>http://joshuak74.egloos.com/1727544#comments</comments>
		<pubDate>Sat, 01 Apr 2006 06:12:38 GMT</pubDate>
		<dc:creator>백호</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 구글 창립자들의 유명한 논문, The Anatomy of a Large-Scale Hypertextual Web Search Engine의 번역본 ]]> </title>
		<link>http://joshuak74.egloos.com/1702233</link>
		<guid>http://joshuak74.egloos.com/1702233</guid>
		<description>
			<![CDATA[ 
  <a href="http://www.emh.co.kr/xhtml/google_search_engine.html">http://www.emh.co.kr/xhtml/google_search_engine.html</a> &nbsp;<br />
아는 분들이 몇번 물어보셨는데요. 깔끔하게 번역해 놓으셨습니다.<br /><br />			 ]]> 
		</description>

		<comments>http://joshuak74.egloos.com/1702233#comments</comments>
		<pubDate>Tue, 28 Mar 2006 03:02:22 GMT</pubDate>
		<dc:creator>백호</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 내 블로그에 링크를 건 블로거 찾기 ]]> </title>
		<link>http://joshuak74.egloos.com/1678517</link>
		<guid>http://joshuak74.egloos.com/1678517</guid>
		<description>
			<![CDATA[ 
  <br />
네이버 블로그를 쓰다가 이글루스를 블로그를 쓰면서 불편했던 점은 누가 내 블로그를 링크걸었는지... 누가 방문했는지를 알기 어렵다는 것이었습니다.(아무래도 서비스의 강조 지점이 많이 다를테니까요.)<br />
<br />
우연히 Google Help를 뒤지다가 자신의 블로그를 링크 건 블로거를 찾는 쉬운 방법을 찾았습니다.<br />
<br />
Google 검색창에<br />
<br />
link: + URL을 쳐보세요~<br />
<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds2.egloos.com/pds/1/200603/24/69/c0052869_14114535.jpg" width="500" height="262.905162065" onclick="Control.Modal.openDialog(this, event, 'http://pds2.egloos.com/pds/1/200603/24/69/c0052869_14114535.jpg');" /></div><br />
<br /><br />			 ]]> 
		</description>

		<comments>http://joshuak74.egloos.com/1678517#comments</comments>
		<pubDate>Fri, 24 Mar 2006 05:14:17 GMT</pubDate>
		<dc:creator>백호</dc:creator>
	</item>
	<item>
		<title><![CDATA[ All Things Web 2.0 - "THE LIST" ]]> </title>
		<link>http://joshuak74.egloos.com/1677936</link>
		<guid>http://joshuak74.egloos.com/1677936</guid>
		<description>
			<![CDATA[ 
  <a href="http://www.sacredcowdung.com/archives/2006/03/all_things_web.html">http://www.sacredcowdung.com/archives/2006/03/all_things_web.html</a><br />
<br />
훔 많기도 하다. 2.0 꼬리표... 전에 닷컴 열풍시에 붙었던 .com 꼬리표처럼 남발되는 것 같기도 합니다. ^^<br /><br />			 ]]> 
		</description>

		<comments>http://joshuak74.egloos.com/1677936#comments</comments>
		<pubDate>Fri, 24 Mar 2006 03:02:54 GMT</pubDate>
		<dc:creator>백호</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 블로거간의 대화를 관리해주는 서비스 ]]> </title>
		<link>http://joshuak74.egloos.com/1652522</link>
		<guid>http://joshuak74.egloos.com/1652522</guid>
		<description>
			<![CDATA[ 
  블로그에서 늘 불편하던 것은<br />
<br />
- 내가 단 댓글에 블로그 주인장이 답을 했는지...<br />
- 특정 이슈가 된 블로그의 댓글을 보기위해선 자주 방문하는 방법 밖에 없다는...<br />
<br />
이런 문제들을 해결해주고 블로거들 사이의 대화를 추적, 관리해주는 서비스가 있었습니다.<br />
<br />
<a href="http://co.mments.com/">http://co.mments.com/</a><br />
<br />
재미있네요.~ @.@<br />
<br />
<br /><br />			 ]]> 
		</description>
		<category>Web 2.0</category>

		<comments>http://joshuak74.egloos.com/1652522#comments</comments>
		<pubDate>Mon, 20 Mar 2006 02:56:53 GMT</pubDate>
		<dc:creator>백호</dc:creator>
	</item>
	<item>
		<title><![CDATA[ Beyond the Commons : Investigating the Value of Personalizing Web Search ]]> </title>
		<link>http://joshuak74.egloos.com/1629686</link>
		<guid>http://joshuak74.egloos.com/1629686</guid>
		<description>
			<![CDATA[ 
  <br />
<a href="http://haystack.lcs.mit.edu/papers/teevan.pia2005.pdf">http://haystack.lcs.mit.edu/papers/teevan.pia2005.pdf</a><br />
<br />
본 논문은 개인화 검색에 대한 것입니다.<br />
<br />
저자들은 먼저 현재 사용화되어 있는 검색엔진들이 Ranking한 검색결과가 실제로 각각 개인의 지각된 관련성과 얼마나 연결될 것인지에 대한 실험을 수행하였습니다.<br />
<br />
아래의 그림처럼 높은 랭킹의 결과인 경우에는 지각된 관련성과 연결되었지만 랭킹 순위가 5위 이하로 갈 경우에는 많은 부분 차이가 났습니다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds2.egloos.com/pds/1/200603/16/69/c0052869_1417392.jpg" width="463" height="298" onclick="Control.Modal.openDialog(this, event, 'http://pds2.egloos.com/pds/1/200603/16/69/c0052869_1417392.jpg');" /></div><br />
<br />
<br />
<p>이는 현재 검색 엔진의 랭킹 중 상위 것들을 제외하면 실제 개별 사용자의 지각된 관련성과 많이 차이가 난다는 것입니다.</p><p>이는 같은 질의어에 대해 각각 개인별로 다른 평가를 한다는 것과 동시에 같은 질의어에 같은 의도를 가지고 있어도 그 결과를 다르게 평가한다는 것입니다.</p><p>본 논문은 이러한 문제를 해결하는 것이 개인화 검색이며 앞으로 계속 연구되어야 할 것이라고 결론을 내리고 있습니다.</p><p>너무 당연한 이야기인가요. -.-;;;</p><br /><br />			 ]]> 
		</description>

		<comments>http://joshuak74.egloos.com/1629686#comments</comments>
		<pubDate>Thu, 16 Mar 2006 05:21:19 GMT</pubDate>
		<dc:creator>백호</dc:creator>
	</item>
	<item>
		<title><![CDATA[ Oodle의 주요한 Q&A ]]> </title>
		<link>http://joshuak74.egloos.com/1629065</link>
		<guid>http://joshuak74.egloos.com/1629065</guid>
		<description>
			<![CDATA[ 
  &nbsp;<br />
<a href="http://oodle.typepad.com/oodleblog/2006/03/some_qa_.html">http://oodle.typepad.com/oodleblog/2006/03/some_qa_.html</a><br />
<br />
- 벼룩시장류의 사이트를 크롤링해서 검색시켜주는 우들에게 중요한 것은 Fresh함. 즉 자신의 매물이나 최신의 매물을 남들보다 먼저 확인하는 것이 중요하다는 이야기. 인덱스 업데이트가 5분내로 이루어 질 수 있도록 노력하고 있군요.<br />
<br />
- 또 개별 사이트를 더 잘 크롤링하기 위한 특수한 크롤러인 '<span style="COLOR: #333300">micro-spiders</span>'를 운영하고 있으며 큰 사업자로부터는 직접 DB를 넘겨받기도 하는 것 같습니다.<br />
<br />
Some Q&amp;A <br />
<div class="entry-content"><div class="entry-body"><p class="MsoNormal"><span style="COLOR: #333300">We’ve been very happy to see the prominence of search in the classifieds market grow so quickly.&nbsp; &nbsp; We believe that search is a vital element to making online classifieds a great medium for both buyers as well as classified advertisers.&nbsp; Another search engine for classifieds launched yesterday.&nbsp; We welcome Vast to the crusade.&nbsp; <?XML:NAMESPACE PREFIX = O /><o:P></o:P></span></p><p class="MsoNormal"><span style="COLOR: #333300"><o:P></o:P>I have received a bunch of questions in the last 24 hours.&nbsp; Thought I'd post some of my replies here:<o:P></o:P></span></p><p class="MsoNormal"><strong><span style="COLOR: #333300">How many sites does Oodle reference in it’s index?<o:P></o:P></span></strong></p><p class="MsoNormal"><span style="COLOR: #333300">We index both ends of the long tail and point to over 50k sites.&nbsp; <o:P></o:P></span></p><p class="MsoNormal"><strong><span style="COLOR: #333300">How many listings does Oodle index?<o:P></o:P></span></strong></p><p class="MsoNormal"><span style="COLOR: #333300">In our current coverage area (just over 100 metros), we have 10M active listings.&nbsp; &nbsp;This only includes listings that are fresh and relevant: we keep track of all the listings we’ve seen and auto-expire old ones that are still online and exclude things that look like listings but aren't (reviews, spam, etc.).&nbsp; &nbsp;This number also doesn’t include listings currently in our index but outside of our coverage area.&nbsp; In next month, we’ll be rolling out millions more listings as we expand our footprint.&nbsp; <o:P></o:P></span></p><p class="MsoNormal"><strong><span style="COLOR: #333300">How old is your index?<o:P></o:P></span></strong></p><p class="MsoNormal"><span style="COLOR: #333300">Our index is refreshed every few minutes.&nbsp; From the time we first see a listing online, clean/tag/rank it, and push it out to our index is usually under 5 minutes (and we’re working hard to reduce that number).<o:P></o:P></span></p><p class="MsoNormal"><span style="COLOR: #333300">It’s essential for a classifieds search engine index to be fresh.&nbsp; Unlike auctions, where you want to be the last person to respond, with classifieds you want to be the first.&nbsp; &nbsp;That’s also why we offer alerts, so people can be notified in minutes when something they are looking for becomes available. <o:P></o:P></span></p><p class="MsoNormal"><strong><span style="COLOR: #333300">How does your crawling technology work?<o:P></o:P></span></strong></p><p class="MsoNormal"><span style="COLOR: #333300">We use a hybrid approach. Some crawlers look for sites to crawl.&nbsp; We also have a farm of "micro-spiders" that target collections of similar sites.&nbsp; We also get data feeds from a large number of partners.<o:P></o:P></span></p><p><strong>When will you offer an API?</strong></p><p>This is mentioned in my previous post.&nbsp; &nbsp;We have an API that we've deployed with a few partners.&nbsp; It will be publicly available in the near future.&nbsp; If you're interested in using it in the meantime, email us at partner@oodle.com.&nbsp; &nbsp;</p><p>We also offer RSS which has always been available.</p></div></div><br /><br />			 ]]> 
		</description>
		<category>검색</category>

		<comments>http://joshuak74.egloos.com/1629065#comments</comments>
		<pubDate>Thu, 16 Mar 2006 02:34:52 GMT</pubDate>
		<dc:creator>백호</dc:creator>
	</item>
	<item>
		<title><![CDATA[ MS의 Live Search 개발자의 이야기 ]]> </title>
		<link>http://joshuak74.egloos.com/1617454</link>
		<guid>http://joshuak74.egloos.com/1617454</guid>
		<description>
			<![CDATA[ 
  &nbsp;<br />
<a href="http://www.selberg.org/2006/03/12/live-baby-live/">http://www.selberg.org/2006/03/12/live-baby-live/</a><br />
<br />
구글과 MS의 접근방식이 다르다는 것은 오해라고 주장하고 있습니다.<br />
<br />
결국 기능의 이슈고 사용자가 만족하는 기능을 구현 제공하는 것이 공통 과제라는 것입니다.<br />
<br />
기술이 아니라 사용자 가치!!!<br /><br />			 ]]> 
		</description>
		<category>검색</category>

		<comments>http://joshuak74.egloos.com/1617454#comments</comments>
		<pubDate>Tue, 14 Mar 2006 02:37:48 GMT</pubDate>
		<dc:creator>백호</dc:creator>
	</item>
</channel>
</rss>
