<?xml version="1.0" encoding="utf-8" ?>
<?xml-stylesheet href="http://rss.egloos.com/style/blog.xsl" type="text/xsl" media="screen"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/">
<channel>
	<title>Null Model</title>
	<link>http://nullmodel.egloos.com</link>
	<description>::</description>
	<language>ko</language>
	<pubDate>Mon, 02 Nov 2009 17:19:16 GMT</pubDate>
	<generator>Egloos</generator>
	<image>
		<title>Null Model</title>
		<url>http://pds7.egloos.com/logo/200712/26/94/a0007594.gif</url>
		<link>http://nullmodel.egloos.com</link>
		<width>80</width>
		<height>68</height>
		<description>::</description>
	</image>
  	<item>
		<title><![CDATA[ 지마켓의 신기한 자바스크립트 오류 해결법 ]]> </title>
		<link>http://nullmodel.egloos.com/1964669</link>
		<guid>http://nullmodel.egloos.com/1964669</guid>
		<description>
			<![CDATA[ 
  겨울옷을 사러 갔다. 비싸! 인터넷으로 옷을 사면 싸다는 말을 듣고 지마켓에 가보았다. 싸! <br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds17.egloos.com/pds/200911/03/94/a0007594_4aef1207a431f.jpg" width="500" height="245" onclick="Control.Modal.openDialog(this, event, 'http://pds17.egloos.com/pds/200911/03/94/a0007594_4aef1207a431f.jpg');" /></div><br />
주문을 했다. 안 와! 열흘이 지났다. 왔다. 그런데 작아! 반품을 하려고 들어가봤다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200911/03/94/a0007594_4aef0829ce4f3.png" width="500" height="156.351791531" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200911/03/94/a0007594_4aef0829ce4f3.png');" /></div>깨알만하게 쓰여있는 취소/반품/교환안내 버튼. 오케이. 클릭. 팝업이 떴다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200911/03/94/a0007594_4aef082abbf98.png" width="496" height="698" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200911/03/94/a0007594_4aef082abbf98.png');" /></div>반품신청 하러가기. 좋아. 클릭. 이거 뭐야. 안되잖아? 팝업창 아래를 보니 자바스크립트 에러. opener라는 객체가 없단다. 이게 뭔 소리야. 소스코드를 열어보았다. "반품신청 하러가기" 버튼을 클릭하면 아래 함수가 실행되도록 되어 있다.<br />
<br />
<div style="padding: 1em; background: black none repeat scroll 0% 0%; -moz-background-clip: border; -moz-background-origin: padding; -moz-background-inline-policy: continuous; color: white;"><span style="color: rgb(255, 102, 0);">function</span> parentGo(){<br />
&nbsp;&nbsp;&nbsp;&nbsp;    opener.document.location.href = <span style="color: rgb(51, 204, 0);"> "http://www.gmarket.co.kr/challenge/neo_my_gd/order_contract_edit_list.asp"</span>;<br />
&nbsp;&nbsp;&nbsp;&nbsp; self.close();<br />
}<br />
</div><br />
아마도 팝업창에서 "반품신청 하러가기"를 클릭하면 원래 창이 반품신청 하는 곳으로 이동하게 짜두었나 보다. 부모창 id가 opener겠지. 부모창으로 갔다. 소스코드 보기. 찾기. opener.<br />
<br />
<div style="padding: 1em; background: black none repeat scroll 0% 0%; -moz-background-clip: border; -moz-background-origin: padding; -moz-background-inline-policy: continuous; color: white;"><span style="color: rgb(255, 102, 0);">function</span> eventDreamAuction(){<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;    opener.document.location.href=<span style="color: rgb(51, 204, 0);">"http://www.gmarket.co.kr/challenge/neo_auctio/auction_goods.asp?goodscode=&amp;auc_no=&amp;check_yn=Y"</span>;<br />
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;    opener.document.focus();<br />
}<br />
</div><br />
이 놈의 opener는 도대체 뭐야. 찾기. eventDreamAuction. 검색결과 없음. 엥? 이놈의 opener는 도대체 뭐야?<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds17.egloos.com/pds/200911/03/94/a0007594_4aef122f4f206.jpg" width="291" height="214" onclick="Control.Modal.openDialog(this, event, 'http://pds17.egloos.com/pds/200911/03/94/a0007594_4aef122f4f206.jpg');" /></div>고객센터로 전화.<br />
<br />
나: 반품신청하려는데 버튼이 먹통이네요. 아마 자바스크립트 에러가 난 것 같은데..<br />
상담원: 반품신청하려고 하신다고요? 주문번호가 어떻게 되시죠?<br />
나: (아, 일단 반품신청부터 해야지) 블라블라<br />
<br />
어찌어찌 반품신청을 했다. 배송료는 내가 내야 한단다. 좋아. 배송료를 내러 갔다. 배송료를 내는 방법은 세 가지. 카드 결제하는 건 없다. 환불액에서 차감할 수 있단다. 음. 이건가 보군. 선택. 결제 확인.<br />
<br />
난데없이 5천원을 결제하란다. <br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds17.egloos.com/pds/200911/03/94/a0007594_4aef1275dc02e.jpg" width="400" height="294" onclick="Control.Modal.openDialog(this, event, 'http://pds17.egloos.com/pds/200911/03/94/a0007594_4aef1275dc02e.jpg');" /></div><br />
다시 고객센터로 전화.<br />
<br />
나: 배송료 카드 결제는 없고, 환불액에서 차감하는 걸 선택했는데 또 뭘 결제하라네요?<br />
상담원: 고객님께서 카드로 결제하셨기 때문에 차감은 안되시고요, 배송료는 카드로 결제해주셔야 합니다.<br />
나: 그러니까, 차감을 선택한 다음에 카드로 결제하라고요?<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds17.egloos.com/pds/200911/03/94/a0007594_4aef12a12007a.jpg" width="398" height="278" onclick="Control.Modal.openDialog(this, event, 'http://pds17.egloos.com/pds/200911/03/94/a0007594_4aef12a12007a.jpg');" /></div>나: 그리고 반품신청 버튼도 자바스크립트 에러 나서 클릭이 안되는데..<br />
상담원: 그건 고객님 컴퓨터 문제기 때문에 저희가 도와드릴 수 없습니다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200911/03/94/a0007594_4aef12ee0b2fa.jpg" width="251" height="361" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200911/03/94/a0007594_4aef12ee0b2fa.jpg');" /></div>자바스크립트 에러 나는 게 왜 내 컴퓨터 문제야.<br />
<br />
나: 아니, 그게 그럴 수가 없거든요? 혹시 기술부서랑 통화할 수 있나요?<br />
상담원: 네.. 그럼 저희쪽에서 연락드리도록 하겠습니다. 언제 통화가능하신가요?<br />
나: 4시쯤 해주세요.<br />
<br />
오케이. 상담원한테 자바스크립트 얘기해봐야 소용없지. 시간은 흘러 오후 4시. 따르릉.<br />
<br />
기술자: 고객님, 반품신청하는데 문제가 있으시다고요?<br />
나: 아뇨. 반품신청은 전화로 했는데, 인터넷에서 그 버튼이 클릭이 안되더라고요? 제가 보니까 자바스크립트 에러가..<br />
기술자: 고객님, 원격접속 해봐도 되겠습니까?<br />
나: 아니 자바스크립트 에러가 나는데 왜 원격접속을 하나요?<br />
기술자: 그게 고객님 PC 문제거든요.<br />
나: 그럴리가 없을 것 같은데요?<br />
기술자: 저희가 고객님 말고는 반송신청에 문제가 있다는 보고가 들어온 적이 없거든요. 저희 쪽 문제라면 전화가 쏟아지지 않겠습니까?<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200911/03/94/a0007594_4aef1300a93c7.gif" width="300" height="257" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200911/03/94/a0007594_4aef1300a93c7.gif');" /></div> 문득 스쳐지나간 <a href="http://thisisgame.com/board/view.php?id=188182&amp;board=0&amp;category=106&amp;subcategory=2&amp;page=1&amp;best=&amp;searchmode=title&amp;search=&amp;orderby=&amp;token=">원사운드 만화 한 편</a>. 뭐. 일단 속는 셈치고 해보자. 지마켓 홈페이지의 고객센터로 들어가니 원격접속하는 프로그램을 다운 받을 수 있다. 이거 신기한 걸? 프로그램 실행.<br />
<br />
기술자가 원격접속으로 들어오더니 컴퓨터에 설치된 보안 프로그램들을 열심히 지우기 시작한다. 오, 보안 프로그램 때문에 자바스크립트 에러가 뜰 수도 있구나 신기한데? 인터넷 임시 파일도 지우고, 익스플로러 설정도 초기화한다. 음. 역시 마이크로소프트 이 개노무 자식들 브라우저를 어떻게 만들었길래! <br />
<br />
나: 자, 이제 다시 해볼까요? <br />
<br />
"취소/반품/교환 안내" 클릭. "반품신청 하러가기" 클릭. 오..<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200911/03/94/a0007594_4aef13151bf08.jpg" width="203" height="507" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200911/03/94/a0007594_4aef13151bf08.jpg');" /></div><br />
<div style="text-align: center;"><font size="6">안되잖아!!!!!!!</font><br />
</div><br />
<br />
자바스크립트가 잘못되어 있는데 설마 보안 프로그램 지운다고 그게 되겠냐 말이지. 정말 전화가 쏟아지지 않는게 신기하군. 하여간 이 기술자를 닥달해봐야 역시 소용없는 일이라, QA팀이나 개발팀하고 연결해달라고 하니, 그건 무리고 전달은 해주겠단다. 물론 아주 길고 지루한 변명도 들었지만 그건 일일이 옮기기도 귀찮다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200911/03/94/a0007594_4aef13400aab4.jpg" width="500" height="210" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200911/03/94/a0007594_4aef13400aab4.jpg');" /></div>오늘 덕분에 전화 통화만 다 합쳐서 한 시간을 했다. 상담원과 기술자야 무슨 잘못이 있겠냐. 링크 하나도 자바스크립트로 떡칠을 해놓고 그나마도 에러를 내서 아예 링크를 먹통으로 만들어놓은 개발팀. 이런 오류를 못 찾아낸 QA팀(있기는 있나?). 그리고 대형 인터넷 쇼핑몰을 운영하면서 상담원과 기술자에게 "자바스크립트 에러"라는 말이 무슨 뜻인지 알려주지 않은 경영진. 이거나 받아라.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200911/03/94/a0007594_4aef11b5725f1.gif" width="340" height="240" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200911/03/94/a0007594_4aef11b5725f1.gif');" /></div>내가 다시는 지마켓에서 뭘 사나 봐라.<br />
<br />
<br/><br/>tag : <a href="/tag/지마켓" rel="tag">지마켓</a>,&nbsp;<a href="/tag/자바스크립트" rel="tag">자바스크립트</a>,&nbsp;<a href="/tag/난처한순간" rel="tag">난처한순간</a>			 ]]> 
		</description>
		<category>지마켓</category>
		<category>자바스크립트</category>
		<category>난처한순간</category>

		<comments>http://nullmodel.egloos.com/1964669#comments</comments>
		<pubDate>Mon, 02 Nov 2009 17:14:46 GMT</pubDate>
		<dc:creator>아이추판다</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 로고의 정체? ]]> </title>
		<link>http://nullmodel.egloos.com/1960479</link>
		<guid>http://nullmodel.egloos.com/1960479</guid>
		<description>
			<![CDATA[ 
  오늘 지나가다 본 간판에 있는 로고.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200910/20/94/a0007594_4addabd2ef0ba.png" width="348" height="339" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200910/20/94/a0007594_4addabd2ef0ba.png');" /></div><br />
처음엔 "헉, 콘돔"했다가 다시 보니 아마도 젖병인 듯하다. 그런데..<br />
<br />
<br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<div style="text-align: center;"><font size="6">.</font><br />
</div><br />
<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200910/20/94/a0007594_4addabd3710b2.png" width="500" height="134.765625" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200910/20/94/a0007594_4addabd3710b2.png');" /></div><br />
동태찜하고 젖병이 무슨 상관이지?<br />
<br />
<br/><br/>tag : <a href="/tag/어색한순간" rel="tag">어색한순간</a>			 ]]> 
		</description>
		<category>어색한순간</category>

		<comments>http://nullmodel.egloos.com/1960479#comments</comments>
		<pubDate>Tue, 20 Oct 2009 12:28:44 GMT</pubDate>
		<dc:creator>아이추판다</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 텍스트의 통계학: (3) 네 주제를 알라 ]]> </title>
		<link>http://nullmodel.egloos.com/1958448</link>
		<guid>http://nullmodel.egloos.com/1958448</guid>
		<description>
			<![CDATA[ 
   <a href="http://nullmodel.egloos.com/1955504">텍스트의 통계학: (1) 구글신의 새 마음</a><br />
<a href="http://nullmodel.egloos.com/1956967">텍스트의 통계학: (2) 셰익스피어의 영혼은 몇 그램?</a><br />
<br />
지난 번에는 간단하게 단어의 순서, 즉 문법을 통계적으로 분석하는 방법을 알아보았다. 제대로 문법을 분석하려면 일단 문법 이론부터 설명해야하니까 그건 과감하게 넘어가겠다. 원래 이 연재가 좀 수박 겉핥기다.<br />
<br />
이번에는  텍스트의 '주제'를 통계적으로 파악하는 방법을 다뤄보도록 하겠다. 일단 시작은 지난 번과 마찬가지로 유니그램(unigram) 모형이다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200910/14/94/a0007594_4ad4a0b873b46.png" width="213" height="265" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200910/14/94/a0007594_4ad4a0b873b46.png');" /></div>지난번에는 까만 동그라미를 여러 개 그려놓았는데 이번에는 까만 동그라미 주변에 네모를 쳐놨다. 그래프 모형에서 네모는 그 안에 있는 기호들이 반복된다는 의미다. 즉, 하나의 텍스트에는 여러 개의 단어가 반복되고, 이것이 인터넷 전체에 반복된다는 뜻이다. 원래는 텍스트, 인터넷 자리에 반복되는 횟수, N이 들어가지만 편의상 표기법을 바꿨다.<br />
<br />
유니그램 모형에서 모든 단어는 무작위적으로 나타난다. 그런데 그건 사실이 아니다. 이걸 좀 더 그럴 듯하게 바꿔보자. 모든 텍스트에는 주제가 있다. 그리고 주제가 같은 글에는 단어들이 나타나는 패턴이 비슷하다. 예를 들어 정치에 관련된 글이라면 '국회'나 '선거' 같은 단어가 많이 나올 것이고, 경제에 관련된 글이라면 '고용'이나 '금융' 같은 단어가 많이 나올 것이다. 즉, 유니그램은 유니그램이지만 주제에 따라서 유니그램의 단어 분포가 달라지는 것이다. 이것이 유니그램 혼합 모형(Mixture of unigrams model)이다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200910/14/94/a0007594_4ad4a0b7e8f22.png" width="295" height="266" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200910/14/94/a0007594_4ad4a0b7e8f22.png');" /></div><br />
그런데 사실 우리는 어떤 글의 주제를 직접적으로 관찰할 수가 없다. 그래서 유니그램 혼합 모형에서 모든 텍스트는 여러 가지 주제가 확률적으로 중첩된 상태가 된다. 예를 들어 정치 관련 글에서 '국회'라는 단어가 나타날 확률이 1%, 경제 관련 글에서는 0.5%라고 해보자. 어떤 글이 정치 관련 글일 확률이 80%고, 경제 관련 글일 확률이 20%면 이 글에서 '국회'라는 단어가 나타날 확률은 80% × 1% + 20% × 0.5% = 0.9%가 된다.<br />
<br />
이걸 두 가지로 생각할 수 있는데, 한 가지는 이 글은 경제 관련 글이거나 아니면 정치 관련 글인데 다만 우리가(정확히 말하면 컴퓨터가) 모를 뿐이다. 또 하나는 이 글의 주제 자체가 80%는 정치고 20%는 경제다. 사실 똑부러지게 어떤 주제에 속하는 글이란 없으므로 후자의 해석이 좀 더 마음에 든다. 그러면 아예 작심하고 이걸로 확장해보자.<br />
<br />
마지막으로 소개할 모형은 그렇게 '작심하고 확장한' 모형으로, 잠재 디리클레 할당 모형(Latent Dirichlet Allocation model: 이하 LDA 모형)이라는 외계어로 된 이름을 가지고 있다. 재미로 덧붙이자면 LDA 모형을 만든 사람 중에 하나의 이름은 '마이클 조던(Michael I. Jordan)'이다. <br />
<br />
LDA 모형에서 하나의 문서에는 여러 가지 주제가 혼합되어 있다. 그리고 단어 하나 하나는 이런 주제들 중에 하나를 반영한다. 예를 들어 "국회는 금융 관련 법안을.."이라는 문장이 있다면 '국회'와 '법안'은 정치적 주제를 반영하고, '금융'은 경제적 주제를 반영하는 식이다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200910/14/94/a0007594_4ad4a0b86fa7f.png" width="423" height="404" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200910/14/94/a0007594_4ad4a0b86fa7f.png');" /></div>그림에서 α,β가 뭘 뜻하는지는 알 거 없고, '문서'라고 표시된 하얀 동그라미는 그렇게 혼합된 주제를 뜻하며 '주제'라고 표시된 하얀 동그라미는 문서가 가진 주제들 중에 각 단어가 반영하는 주제를 뜻한다. 유니그램 혼합 모형과 마찬가지로 문서의 혼합된 주제나 단어가 반영하는 주제나 모두 관찰되지 않기는 마찬가지이므로 이것들도 전부 중첩되어 있다. 독자들의 혼란을 막기 위해 자세한 설명은 생략한다.<br />
<br />
아래 그림은 AP 말뭉치(corpus: 전산언어학 연구를 위해 실제 사용되는 말과 글을 대량으로 수집한 데이터베이스)에서 뽑아낸 한 문단을 LDA모형으로 분석한 것이다. 빨간색은 '예술', 초록색은 '예산', 파란색은 '아동', 자주색은 '교육'이라는 주제를 반영할 확률이 가장 높은 단어들이다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200910/14/94/a0007594_4ad4a0ba737f2.png" width="500" height="172.325976231" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200910/14/94/a0007594_4ad4a0ba737f2.png');" /></div>잘보면 '오페라(opera)'나 '음악(music)' 같은 단어들은 '예술'을 반영할 확률이 가장 높고, '재단(foundation)'이나 '이사회(board)'는 예산, '젊은(young)'이나 '기회(opportunity)'는 아동, '학교(school)'이나 '가르치다(taught)'는 교육을 반영할 확률이 가장 높다고 분석된 것을 알 수 있다. 이것은 LDA 모형이 이 단어가 실제로 무슨 뜻인지도 전혀 모른채 오로지 통계적으로만 분석한 것이다.<br />
<br />
LDA 모형의 재밌는 점은 동음이의어도 문맥에 따라 어떤 주제에 속하는지 지능적으로 분류한다는 것이다. 예를 들어 '은행'이라는 단어는 금융기관을 뜻하기도 하고, 나무 열매를 뜻하기도 한다.  글에 따라 LDA모형은 '은행'이라는 단어가 금융기관을 말하는 건지 나무 열매를 말하는 건지 자동적으로 분류할 수 있다. <br />
<br />
완벽하진 않지만 텍스트의 주제를 통계적으로 처리할 수 있기 때문에 LDA 모형을 이용하면 재미있는 실험들을 할 수 있다. 그리피스와 스타이버는 PNAS라는 과학 잡지에 실린 논문 28,154편의 초록을 LDA 모형으로 분석해서 시간의 흐름에 따라 뜨는 주제와 가라앉는 주제를 찾아냈다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds17.egloos.com/pds/200910/14/94/a0007594_4ad4a0b973998.png" width="500" height="322.727272727" onclick="Control.Modal.openDialog(this, event, 'http://pds17.egloos.com/pds/200910/14/94/a0007594_4ad4a0b973998.png');" /></div><br />
그림 하단은 각 주제의 번호와 그 주제에서 특징적인 단어의 목록이다. 그림 상단의 그래프는 이 주제들의 논문들에서 차지하는 비중의 시간에 따른 변화를 나타낸 것이다. 대부분 생물학과 관련된 주제라서 뭔지는 정확히 모르겠는데 가라앉는 주제들 중에 37번 주제는 클로닝, 289는 분자생물학의 주제 중에 하나, 75번은 면역학의 주제 중에 하나인 것 같다. 그리고 뜨고 있는 주제 중에 2번은 지구 온난화, 134번은 유전자 녹아웃, 179번은 세포 사멸에 관한 것 같다.<br />
<br />
나도 똑같은 기법을 이용해 이글루스 뉴스밸리의 글들을 LDA 모형으로 분석한 적이 있는데 그 결과는 <a href="http://nullmodel.egloos.com/1912746">이글루스 5월의 떡밥들</a>에 정리되어 있다. 관련 대목만 다시 가져와보면 아래와 같다.<br />
<br />
<div style="border: 1px solid ; padding: 1em; background: ivory none repeat scroll 0% 0%; -moz-background-clip: border; -moz-background-origin: padding; -moz-background-inline-policy: continuous;"><div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds10.egloos.com/pds/200906/01/94/a0007594_4a22ed10f3850.png" width="500" height="450" onclick="Control.Modal.openDialog(this, event, 'http://pds10.egloos.com/pds/200906/01/94/a0007594_4a22ed10f3850.png');" /></div>5월동안 이글루스 뉴스밸리에서 논의의 흐름을 위의 그래프만으로 정리해보자. 뉴스밸리는 5월초 주제49(경찰, 시위..)에 대한 이야기로 뜨거웠고 5월 중순에 들어서면서 주제26(북한, 미국..), 주제38(시장, 대우..), 주제44(황우석, 돼지..), 주제40(덕후위원회..), 주제17(서울, 한국, 전교조..) 등이 수면 위로 떠올랐다. 그리고 하순에는 주제8,9(교육, 감사, 한예종..), 주제34(집회, 노동..), 주제50(사건, 헌법..)에 대해 이야기가 쏟아져 나왔다. 그리고 23일. 노무현 전 대통령 서거로 애도의 글들이 쏟아져 나왔고(주제 4, 7, 19, 20, 32) 며칠 지나자 서거 당시 상황에 대한 의혹을 두고 여러 가지 글들이 올라왔다(주제 41, 48). </div><br />
이런 방법론을 인문학이나 사회과학에서도 활용할 수 있을 것이다. 인문학이나 사회과학에서 텍스트를 분석하는 것은 대체로 질적 방법론에 속하는데, 사람마다 해석이 다른 건 둘째치고라도 방대한 문헌에서 나타나는 경향성을 일일이 사람이 살펴보는 것 자체가 상당한 노가다다. <br />
<br />
그런데 LDA 모형 같은 것을 이용하면&nbsp; 조선왕조실록에 어떤 주제들이 있고, 시대에 따라 실록에 나타나는 기록의 주제들이 어떻게 변화하는지 살펴볼 수도 있겠고, 어떤 사건이 벌어졌을 때 언론사마다 다른 보도의 초점이나 시간에 따라 보도 방식의 변화같은 것을 알아볼 수도 있을 것이다. 이런 정량적 방법을 기존의 질적 방법론과 결합한다면 상당히 재미있는 연구가 여럿 가능할 것 같기도 하다.<br />
<br />
(계속)<br />
<br/><br/>tag : <a href="/tag/전산언어학" rel="tag">전산언어학</a>,&nbsp;<a href="/tag/자연어처리" rel="tag">자연어처리</a>,&nbsp;<a href="/tag/유니그램" rel="tag">유니그램</a>,&nbsp;<a href="/tag/LDA" rel="tag">LDA</a>			 ]]> 
		</description>
		<category>전산언어학</category>
		<category>자연어처리</category>
		<category>유니그램</category>
		<category>LDA</category>

		<comments>http://nullmodel.egloos.com/1958448#comments</comments>
		<pubDate>Wed, 14 Oct 2009 03:05:23 GMT</pubDate>
		<dc:creator>아이추판다</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 텍스트의 통계학: (2) 셰익스피어의 영혼은 몇 그램? ]]> </title>
		<link>http://nullmodel.egloos.com/1956967</link>
		<guid>http://nullmodel.egloos.com/1956967</guid>
		<description>
			<![CDATA[ 
  <a target="_blank" href="http://nullmodel.egloos.com/1955504">텍스트의 통계학: (1) 구글신의 새 마음</a><br />
<br />
텍스트는 문장으로, 문장은 단어로 이뤄져있다. 누군가 "철수는 영희를.."이라고 말하면 우리는 그 다음에 어떤 단어가 나올지 귀를 쫑긋 세우고 기다릴 것이다. 그 다음 자리에는 "사랑한다"가 나올 수도 있고 "미워한다"가 나올 수도 있다. 다시 말해 한 문장에서 어떤 단어가 나올지는 모두 확률적이다. 유니그램(unigram) 모형은 이것을 가장 간단하게 표현하는 것이다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200910/09/94/a0007594_4aceebb6cc0ad.png" width="337" height="124" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200910/09/94/a0007594_4aceebb6cc0ad.png');" /></div>'유니(uni-)'는 '하나', '그램(gram)'은 '말'이라는 뜻이다. 유니그램 모형은 하나하나의 단어가 어떤 확률 분포에서 독립적으로 추출되었다고 가정한다. 쉽게 말해 한 면마다 단어가 쓰인 거대한 주사위를 던져서, 나온 단어들로 문장이 이뤄졌다고 보는 것이다. 물론 말이 안된다. 하지만 단순히 각 단어가 사용되는 빈도를 알고 싶다면 유니그램 모형으로 충분하다.<br />
<br />
유니그램 모형을 가지고 텍스트를 생성할 수도 있다. 단어마다 문장에서 나타날 확률을 알고 있으므로, 거꾸로 단어들을 이 확률에 따라 랜덤하게 생성하는 것이다. 다음은 셰익스피어의 글들을 유니그램 모형에 학습시킨 다음에, 새로운 문장을 생성하게 한 것이다.<br />
<br />
<div style="border: 1px solid ; padding: 1em; background: ivory none repeat scroll 0% 0%; -moz-background-clip: border; -moz-background-origin: padding; -moz-background-inline-policy: continuous;">(a) To him swallowed confess hear both. Which. Of save on trail for are ay device and rote life have.<br />
(b) Every enter now severally so, let.<br />
(c) Hill he late speaks; or! a more to leg less first you enter.<br />
(d) Will rash been and by I the me loves gentle me not slavish page, the and hour; ill let.<br />
(e) Are where exeunt and sighs have rise excellency took of. Sleep knave we. near; vile like.</div><br />
무슨 말인지 해석이 안되는 건 여러분이 영어를 못해서 그런게 아니라 유니그램 모형이 영어를 못해서 그렇다. "or!"라니 도대체 뭔소리야. 유니그램 모형은 그대로 쓸모가 있지만, 아무래도 이것만으로 할 수 있는 건 제한적이다. 그럼 유니그램 모형을 확장해서 좀 더 쓸모 있게 만들어보자.<br />
<br />
그것이 바이그램(bigram) 모형이다. '바이(bi-)'는 '둘'이라는 뜻이다. 아래 그림처럼 한 단어가 나타날 확률이 앞 단어에 영향을 받는다고 가정하는 것이다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200910/09/94/a0007594_4aceebb779590.png" width="337" height="124" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200910/09/94/a0007594_4aceebb779590.png');" /></div><a target="_blank" href="http://nullmodel.egloos.com/1951581">그림으로 보는 통계: (1) 쥐와 사람의 관계</a>에서도 설명했지만 관찰된 사건이 머리-대-꼬리로 연결하는 두 사건 사이에는 아무런 관련이 없다. 위의 그림에서 '사랑한다'가 나타날 확률은 '영희를'에만 영향을 받지, '철수는'에는 영향을 받지 않게 된다. 그래서 바이그램에서는 항상 바로 앞단어와 지금 단어, 두 단어의 관계만 문제가 된다. 그래서 '바이'그램인 것이다. 이 모형은 통계학에서  1차 마코프 연쇄(first-order Markov chain)라고 한다.<br />
<br />
유니그램의 경우와 마찬가지로 바이그램에게 셰익스피어를 학습시켜서, 문장을 생성하게 해보았다.<br />
<br />
<div style="border: 1px solid ; padding: 1em; background: ivory none repeat scroll 0% 0%; -moz-background-clip: border; -moz-background-origin: padding; -moz-background-inline-policy: continuous;">(a) What means, sir. I confess she? then all sorts, he is trim, captain.<br />
(b) Why dost stand forth thy canopy, forsooth; he is this palpable hit the King Henry. Live King. Follow.<br />
(c) What we, hath got so she that I rest and sent to scold and nature bakrupt, nor the first gentleman?<br />
(d) The world shall - my lord!<br />
</div><br />
여전히 말은 안되지만 유니그램 모형보다 좀 더 문장 꼴을 한다. 물론 말이 안되기는 여전히 마찬가지다. 그럼 똑같은 방식으로 바이그램 모형을 확장해서 트라이그램(trigram) 모형을 만들 수도 있겠다. '트라이(tri-)'는 3이라는 뜻이므로 이번엔 한 단어가 나타날 확률이 바로 앞단어만이 아니라 그 앞단어에도 영향을 받는다. 숫자가 하나 더 늘었니까 통계학적 명칭으로는 2차 마코프 연쇄(second-order Markov chain)이 되겠다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds17.egloos.com/pds/200910/09/94/a0007594_4aceebb8080d3.png" width="337" height="161" onclick="Control.Modal.openDialog(this, event, 'http://pds17.egloos.com/pds/200910/09/94/a0007594_4aceebb8080d3.png');" /></div>역시 트라이그램으로 생성한 문장.<br />
<br />
<div style="border: 1px solid ; padding: 1em; background: ivory none repeat scroll 0% 0%; -moz-background-clip: border; -moz-background-origin: padding; -moz-background-inline-policy: continuous;">(a) Sweet prince, Falstaff shall die. Harry of Monmouth's grave.<br />
(b) This shall forbid it should be branded, if renown made it empty.<br />
(c) What is't that cried?<br />
(d) Indeed the duke; and had a very good friend.<br />
(e) The seet! How many then shall posthumus end his miseries.<br />
</div><br />
여전히 말이 안되긴 마찬가지지만 "had a very good firend"처럼 멀쩡한 소리도 한다. 유니그램, 바이그램, 트라이그램 같은 모형을 모두 합쳐서 N그램이라고 부르는데 N을 늘리면 늘릴 수록 점점 더 말같은 소릴 하는 모형을 만들 수 있다. 마지막으로 테트라그램(tetragram) 모형, 3차 마코프 연쇄로 생성한 문장을 보자. 예상했겠지만 테트라(tetra-)는 '넷'이란 뜻이다. <br />
<br />
<div style="border: 1px solid ; padding: 1em; background: ivory none repeat scroll 0% 0%; -moz-background-clip: border; -moz-background-origin: padding; -moz-background-inline-policy: continuous;">(a) King Henry. What! I will go seek the traitor Gloucester. Exeunt some of the watch. Agreat banquet serv'd in;<br />
(b) Will you not tell me who I am?<br />
(c) It cannot be but so.<br />
(d) Indeed the short and the long. Marry, 'tis a noble Lepidus.<br />
(e) They say all lovers sear more performance than they are wont to keep obliged faith unforfeited!<br />
</div><br />
이 간단한 N그램 모형이 N을 늘리면 늘릴 수록 점점 더 셰익스피어처럼 글을 쓴다. 하지만 N그램만으로는 완전한 문장을 쓸 수가 없다. 일단 N그램 모형은 의미론적인 부분을 처리하는 부분이 전혀 없기 때문에 아무리 N이 늘어나도 자기가 무슨 소릴 하고 있는지 모르는데다가, 구문론적인 관계를 전혀 포착하지 못하기 때문이다. 예를 들어 "철수가 영희를 사랑했을 때, 영희는 철수를 미워했다."라는 문장이 있다면 앞 절의 동사가 '과거'이므로 뒷 절의 동사도 '과거'여야 한다. 이런 부분은 단순히 N을 늘려서 포착할 수 있는 게 아니다.<br />
<br />
그래도 N그램 모형은 간단한 텍스트 처리를 할 때는 요긴하다. 예를 들어 "눈이 아파"라는 문장이 있다면 이 '눈'은 펄펄 내리는 눈(雪)이 아니라 사람의 몸에 있는 눈(目)일 확률이 높다는 것 정도는 N그램 모형으로 식별할 수 있다. 따라서 검색엔진 같은데서 활용하면 동음이의어를 더 잘 구별할 수 있게 만들 수 있다.<br />
<br />
또, 오자 교정에도 활용할 수 있다. "바람이 푼다"라는 문장이 있다면 '바람'도 '푼다'도 모두 사전에 있는 말이니까 일반적인 워드프로세서는 오타라고 감지를 하지 못한다. 그런데 N그램 모형을 이용하면  ㅂ을 ㅍ으로 잘못 칠 확률과 '바람이'라는 말 뒤에 '푼다'가 나올 확률을 비교해서 앞의 확률이 높으면 오타라고 판단하고, 뒤의 확률이 높으면 오타가 아니라고 판단하게 만들 수 있다. 간단한 모형만 가지고도 좀 더 영리한 오자 교정 프로그램을 만들 수 있는 것이다. 물론 의도적으로 독특한 표현을 쓸 때는 걸리적거릴 수도 있다.<br />
<br />
N그램은 그 자체로도 쓸모가 있지만 이것을 N을 늘리는 방법 말고 다른 방식으로 계속 확장해보면 아주 재미있는 모형들을 많이 만들 수 있다. 글이 길어졌으므로, 그건 또 나중에.<br />
<br />
(계속)<br />
<br />
<span style="font-weight: bold;">후주</span>. 본문의 N그램으로 생성한 문장 예제는 모두 Jurafsky, D., &amp; Martin, J. H. (2000). <span style="font-style: italic;">Speach and Language Processing</span>. New Jersey:Prentice Hall.에서 인용한 것이다.<br />
<br/><br/>tag : <a href="/tag/전산언어학" rel="tag">전산언어학</a>,&nbsp;<a href="/tag/자연어처리" rel="tag">자연어처리</a>,&nbsp;<a href="/tag/통계학" rel="tag">통계학</a>,&nbsp;<a href="/tag/N그램" rel="tag">N그램</a>,&nbsp;<a href="/tag/마코프연쇄" rel="tag">마코프연쇄</a>			 ]]> 
		</description>
		<category>전산언어학</category>
		<category>자연어처리</category>
		<category>통계학</category>
		<category>N그램</category>
		<category>마코프연쇄</category>

		<comments>http://nullmodel.egloos.com/1956967#comments</comments>
		<pubDate>Fri, 09 Oct 2009 08:45:10 GMT</pubDate>
		<dc:creator>아이추판다</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 텍스트의 통계학: (1) 구글신의 새 마음 ]]> </title>
		<link>http://nullmodel.egloos.com/1955504</link>
		<guid>http://nullmodel.egloos.com/1955504</guid>
		<description>
			<![CDATA[ 
  우리는 역사상 어느 때보다도 많은 텍스트를 가진 시대를 살고 있다. 이 글을 포함해 인터넷에는 오늘도 수많은 글들이 올라오고 있다. 인터넷 초창기에는 웹사이트가 몇 개 없어서 사람이 하나씩 읽어보고 웹사이트들을 분류했다. 야후가 이렇게 시작한 회사다. 하지만 현재는 이런 식으로 사람이 읽고 웹사이트를 읽고 분류하는 것은 불가능하다. 따라서 컴퓨터를 이용해 텍스트를 분류하고 검색할 필요가 있다.<br />
<br />
컴퓨터를 이용해 텍스트를 다루는 것은 컴퓨터 공학에서는 자연어 처리(natural language processing), 언어학에서는 전산언어학(computational linguistics)라고 한다. 심리학에서는 특별한 용어가 없고 다만 이렇게 사람이 하는 걸 컴퓨터로 흉내내는 것을 통틀어 계산 모형(computational model)이라고 부른다. <br />
<br />
전산언어학, 자연어처리, 언어에 대한 계산 모형. 뭐라고 부르든 이들 모두는 언어로 된 자료, 특히 텍스트를 사람과 가급적 비슷하게 잘 처리하는 것이 목적이다. 언어학과 심리학에서 이런 기법들은 단순한 도구가 아니라 검증해볼 수 있는 수단이기도 하다. 이론을 계산 모형으로 만들었을 때, 텍스트를 그럴듯하게 잘 처리하면 그 이론이 실제로 사람의 머리 속에서 일어나는 일을 잘 기술한다고 볼 수 있기 때문이다.<br />
<br />
하지만 전산언어학을 언어학 이론의 검증 수단으로 보는데 반대하는 사람들도 있다. 계산 모형이 잘 안 돌아가는 게 이론이 구리기 때문인지, 그 이론을 구현할만큼 기술이 받쳐주지 않기 때문인지 잘 구별할 수 없기 때문이다. 그런데 이 말을 뒤집어보면 기술이 발전하면 그때는 괜찮다는 뜻도 되므로, 어쨌든 그런 기술을 연구할 값어치는 있는 셈이다. <br />
<br />
전산언어학에서 사용하는 모형에는 두 종류가 있다. 하나는 규칙 중심의 모형이다. 이것은 우리가 예전에 학교에서 영어를 배울 때와 비슷하다. 컴퓨터에 문법과 단어를 몽땅 때려넣는 것이다. 그런데 이 모형은 생각처럼 잘 돌아가지 않는다. 일반적인 텍스트는 학교 문법에 딱딱 맞지도 않고, 오탈자나 신조어도 많기 때문이다. 그럼 사람들이 실제로 말을 하는 문법과 새로 생기는 말, 오탈자로 생길 수 있는 말을 계속 추가해줘야 하는데 이러자면 배보다 배꼽이 커서 실용적이지 못하다.<br />
<br />
또 다른 모형은 통계적 모형이다. 이 단어가 무슨 단어인지, 이게 지금 무슨 문법인지 신경쓰지 않고 그냥 통계로만 싹 발라버리는 방법이다. 일단 만들어서 데이터만 잔뜩 때려넣어주면 컴퓨터가 알아서 '학습'하기 때문에 편리하다. 대신 미묘한 맥락을 잘 파악하지 못하는 단점이 있다. 그래서 두 가지 모형을 섞어서 사용하기도 한다. <br />
<br />
통계적 모형이 규칙 중심 모형보다 대체로 더 잘 작동하기 때문에, 혹자는 우리의 머리 속에 문법 따위는 존재하지 않고 우리의 뇌가 실제로는  언어를 처리하는 일종의 통계장치와 비슷하다고 주장하기도 한다. 통계적 모형이 나날이 발전하고 있기 때문에 이 주장은 점점 더 설득력을 얻어가고 있다. <br />
<br />
한 가지 예를 들어보자. 구글은 검색 결과의 순서를 결정할 때 '페이지 랭크(page rank)'라는 알고리듬을 사용한다. 이 알고리듬은 인터넷의 문서들이 서로 링크로 연결되어 있고, 좋은 문서는 많은 링크를 받는다는 점을 이용한 것이다. 그런데 마음 속에서 개념들도 마치 인터넷의 문서처럼 연결되어 있고, 하나의 개념이 활성화되면 이런 연결 구조를 따라 활성화 확산이 일어난다. 어떤 말을 들으면 이 말과 연결된 개념들이 잇달아 활성화가 되고 다른 개념들과 잘 연결된 개념이 가장 활성화가 되어 머리 속에 떠오른다. 이 과정을 수학적으로 기술해보면 페이지 랭크 알고리듬과 매우 비슷하게 나온다. 실제로 실험을 해보면 페이지 랭크 알고리듬은 사람들이 자유 연상을 했을 때 어떤 단어를 떠올릴 확률을 다른 계산 모형보다 더 잘 예측한다(Griffiths et al., 2007). 따라서 이론적으로는 모든 인터넷 페이지를 외우고 있는 사람에게 어떤 질문을 던졌을 때 그 사람이 가장 먼저 떠올릴 웹페이지는, 구글에서 그 질문을 검색했을 때 결과에서 제일 먼저 나올 페이지와 같다. 덜덜덜.<br />
<br />
물론 앞에서 말한 이유 때문에 실제 텍스트를 잘 처리하는 계산 모형이 우리의 마음을 잘 설명하는 이론이라고  장담할 수는 없다.  어쨌든 재미있기도 하고, 포스팅 소재도 마침 다 떨어졌으므로 텍스트를 다루는 통계적 모형에 대해 하나씩 살펴보자. 언제나 그렇지만 자세한 수학적 설명은 지양하고 과감한 왜곡과 단순화에 기반한 흥미 위주의 연재가 될 것이다. <br />
<br />
(계속)<br />
<br />
참고 문헌<br />
<br />
Griffiths, T. L., Steyvers, M., &amp; Firl, A. (2007). Google and the mind: Predicting fluency with PageRank. <em>Psychological Science, 18,</em> 1069-1076.<br />
<br />
<a target="_blank" href="http://nullmodel.egloos.com/1951581">그림으로 보는 통계: (1) 쥐와 사람의 관계</a><br />
<a target="_blank" href="http://nullmodel.egloos.com/1951974">그림으로 보는 통계: (2) 쥐는 살찌고 사람은 굶는다</a><br />
<a target="_blank" href="http://nullmodel.egloos.com/1953577">그림으로 보는 통계: (3) 바람난 남편, 외계인 아내</a><br />
<br />
<br/><br/>tag : <a href="/tag/전산언어학" rel="tag">전산언어학</a>,&nbsp;<a href="/tag/자연어처리" rel="tag">자연어처리</a>,&nbsp;<a href="/tag/통계학" rel="tag">통계학</a>,&nbsp;<a href="/tag/페이지랭크" rel="tag">페이지랭크</a>			 ]]> 
		</description>
		<category>전산언어학</category>
		<category>자연어처리</category>
		<category>통계학</category>
		<category>페이지랭크</category>

		<comments>http://nullmodel.egloos.com/1955504#comments</comments>
		<pubDate>Mon, 05 Oct 2009 10:32:47 GMT</pubDate>
		<dc:creator>아이추판다</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 인지과학, 진학과 진로 ]]> </title>
		<link>http://nullmodel.egloos.com/1953943</link>
		<guid>http://nullmodel.egloos.com/1953943</guid>
		<description>
			<![CDATA[ 
  방명록에 '동으로'님께서 질문을 <a target="_blank" href="http://nullmodel.egloos.com/1870256#7421941">하나</a> 해주셨다. 요약하자면 대학원 진학과 이후 진로에 관한 것인데 마침 대학원 입시 시즌이기도 하니 다른 분들께도 도움이 될까해서 독립적인 포스팅으로 답변 드린다.<br />
<br />
우선 대학원 진학. 인지과학은 단일 학문이 아니라 자연과학이나 사회과학처럼 여러 분과학문을 묶어서 가리키는 말이다. 인지과학에 속하는 분과학문에는 심리학, 뇌과학, 인공지능, 언어학 및 인접 분야들이 있다. 따라서 대학원에서 인지과학을 전공하려면 인지과학협동과정이나 뇌인지과학과처럼 '인지과학'이라는 이름이 붙은 대학원 과정으로 들어가는 방법과 심리학과, 생물학과, 컴퓨터공학과, 언어학과 등 기존 학과의 대학원에 들어가는 방법이 있다. 어차피 들어가면 똑같은 실험실에서 연구하기 때문에 어디로 들어가든 공부하는 내용에는 큰 차이가 없다. 행정적인 문제나 장학금 지원 등에 차이가 있을 수 있기 때문에 잘 찾아보고 결정하면 된다.<br />
<br />
대학원 과정이 있는 학교는 별로 없는데 부산대, 서울대, 성균관대, 연세대에 인지과학 협동과정이 있고, 올해 고려대, 서울대, 이화여대에 뇌인지과학/공학과가 생겼다. 고려대와 서울대의 뇌인지과학/공학과는 WCU 사업으로 신설된 것이다. 서울대에는 뇌과학협동과정, 인지과학협동과정, 뇌인지과학과 이렇게 비슷한 이름의 세 가지 대학원 과정이 있는데 내용이야 다 비슷하지만 행정적으로 다 다른 과정이므로 주의할 필요가 있다.  대학원 과정들은 기존 학과보다 역사가 짧고, 체제가 잘 안 잡혀 있는 경우가 많기 때문에 '인지과학'이라는 이름만 보고 지원하지 말고 여러 모로 잘 비교해봐야 한다.<br />
<br />
이런 학과들은 실험실 체제로 되어 있고, 학생도 실제로는 실험실 단위로 뽑기 때문에 지도 교수를 잘 고르는 게 중요하다. 관심있는 연구 주제를 다루는 교수를 찾아서 직접 만나도 보고, 대학원생들이나 조교 등을 통해 그 교수의 성격 등도 알아볼 필요가 있다. 참고로 대학원생에게는 연구 주제보다는 교수의 성격이 훨씬 더 중요하다는 걸 강조해둔다. 그 이유는.. 겪어보면 안다. ㅋㅋ<br />
<br />
인지과학은 대단히 넓은 분야기 때문에  진로문제는 학교나 전공에 따라 천차만별라서 자세히 이야기를 하기 어렵다. 대체로 세부전공이 심리학이나 뇌과학 쪽이라면 주로 학계로 간다. 인공지능이나 HCI 쪽이라면 기업 쪽으로 갈 수도 있겠다. 심리학이나 뇌과학 쪽을 전공하고 기업 쪽에 자리잡는 사람도 없지는 않지만 많지도 않다. 가끔은 우주비행사(?)가 되는 사람도 있다. 이 부분은 직접 자세히 알아보는 수 밖에 없다.<br />
<br />
일단 관심이 있다면 석사과정을 다니면서 탐색을 해보는 것도 나쁘지 않다고 생각한다. 자기 학교 자기 전공의 선배들은 어떤 쪽으로 진출하는지, 자기가 연구에 적성이 맞는지 등등은 밖에서 보는 것만으로는 알기 어렵다. 특히 많은 학생들이 의외로 연구라는 게 삽질의 연속이라는데 좌절한다. <br />
<br />
개인적으로는 인지과학을 공부한 사람이 전공을 살리는 방법은 직무가 꼭 전공과 직접적으로 관련되지 않아도 많이 있다고 생각한다. 인지과학은 사람에 관한 것이고, 무슨 일을 하든 결국 사람에 관련되기 때문이다. 하다못해 다 때려치우고 공무원 시험을 준비하더라도 학습과 기억에 대한 인지심리학을 활용할 수 있고, 사기를 치려면 지각심리학이나 사회심리학을.. (쿨럭) 그래서 인지과학에 관심이 있다고 해도 꼭 전공하지 않고 취미로 공부하는 것도 괜찮다고 생각한다. <br />
<br />
다 써놓고 보니 별 얘기는 없는데 혹시 인지과학 쪽으로 대학원에 진학하시려는 분들 중에 궁금한 점을 댓글로 달아주시면 내가 아는 범위에서는 몇 가지 더 얘기드리도록 하겠다. 일단은 여기까지.<br />
<br/><br/>tag : <a href="/tag/인지과학" rel="tag">인지과학</a>,&nbsp;<a href="/tag/대학원" rel="tag">대학원</a>,&nbsp;<a href="/tag/진학" rel="tag">진학</a>			 ]]> 
		</description>
		<category>인지과학</category>
		<category>대학원</category>
		<category>진학</category>

		<comments>http://nullmodel.egloos.com/1953943#comments</comments>
		<pubDate>Wed, 30 Sep 2009 10:03:29 GMT</pubDate>
		<dc:creator>아이추판다</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 그림으로 보는 통계: (3) 바람난 남편, 외계인 아내 ]]> </title>
		<link>http://nullmodel.egloos.com/1953577</link>
		<guid>http://nullmodel.egloos.com/1953577</guid>
		<description>
			<![CDATA[ 
  <a target="_blank" href="http://nullmodel.egloos.com/1951581">그림으로 보는 통계: (1) 쥐와 사람의 관계</a><br />
<a target="_blank" href="http://nullmodel.egloos.com/1951974">그림으로 보는 통계: (2) 쥐는 살찌고 사람은 굶는다</a><br />
<br />
대망의 마지막 회. 일단 베이즈 볼 계산법의 주문을 다시 외어보자.   <span style="color: rgb(204, 0, 0);">"하얀 원으로 연결되면 관련이 있고, 까만 원으로 연결되면 관련이 없다. 머리-대-머리면 반대."</span> 이번에는 반대의 경우인 '머리-대-머리'를 살펴보겠다.<br />
<br />
초가집이 있다. 쥐가 이 집 기둥뿌리를 갉아먹을 수도 있고, 기둥이 썩을 수도 있다. 이 둘은 서로 관련이 없다. 쥐는 기둥뿌리가 썩건말건 갉아먹을 수 있고, 기둥도 쥐가 갉아먹든 말든 썩을 수 있다. 그리고 쥐가 갉아먹어서건 기둥이 썩어서건 아니면 둘 다 때문이건 그렇게 되면 집이 무너질 수 있다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200909/29/94/a0007594_4ac1d510e54f6.png" width="446" height="433" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200909/29/94/a0007594_4ac1d510e54f6.png');" /></div>집이 무너질 수 있다고 해도 여전히 쥐가 기둥을 갉아먹는 것과 기둥이 썩는 것 사이에는 서로 관련이 없다. 이제까지와는 반대로 관찰되지 않은 변수가 머리-대-머리로 연결하는 경우에는 서로 관련이 없는 것이다. <br />
<br />
그런데 추석을 맞아 버려두고 온 고향 옛집에 가봤다고 하자. 가보니 집이 무너졌든 아니면 멀쩡하든 집의 상태가 일단 관찰되면 쥐가 기둥 갉아먹는 것과 기둥이 썩는 것은 이제 관련이 있게 된다.<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200909/29/94/a0007594_4ac1d510f1518.png" width="446" height="433" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200909/29/94/a0007594_4ac1d510f1518.png');" /></div>집이 무너졌다고 해보자. 무너진 집을 조사해보니 쥐가 갉아먹은 흔적이 발견된다면 집이 무너진 이유는 이것으로 설명되기 때문에 기둥이 썩었을 가능성은 낮아진다. 기둥이 썩은 게 발견되어도 마찬가지다. 말이 되는 것 같기도 하고 안되는 것 같기도 하다. 그럼 구체적인 수를 가지고 생각을 해보자.<br />
<br />
어느 폐촌에 초가집 1000채가 있다. 이중에 20%인 200채는 쥐가 기둥뿌리를 갉아먹는다. 역시 20%인 200채는 기둥이 썩었다. 4%인 40채는 기둥이 쥐가 갉아먹은데다가 썩기까지 했다. 그림으로 보면 아래와 같다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200909/27/94/a0007594_4abf02a66e77f.png" width="285" height="285" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200909/27/94/a0007594_4abf02a66e77f.png');" /></div>쥐가 기둥을 갉아먹은 집 200채를 조사해보면 그 중에서 기둥도 썩은 집은 40채(20%)다. 쥐가 기둥을 갉아먹지 않은 집 800채를 조사해보면 그 중에 기둥이 썩은 집은 160채(20%)다. 그러니까 쥐가 갉아먹든 말든 기둥이 썩은 집은 늘 20%인 것이다. 쥐가 기둥을 갉아먹든 말든 기둥이 썩는 것과 관련없다는 건 이 말이다.<br />
<br />
그럼 이제 집이 무너지는 경우를 생각해보자. 쥐가 기둥을 갉아먹은 집이 무너질 확률은 50%다. 기둥이 썩은 집도 50%다. 그러니까 각각 160채 중에 80채가 무너진다. 기둥이 썩은데다 쥐가 갉아먹기까지 했으면 무너질 확률은 80%다. 이런 집은 40채가 있으니 32채가 무너진다. 마지막으로 멀쩡한 집도 640채 중엔 10%인 64채가 무너진다. 이제 무너진 집만 그려보면 아래와 같다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200909/27/94/a0007594_4abf02a6e4da9.png" width="175" height="175" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200909/27/94/a0007594_4abf02a6e4da9.png');" /></div><br />
이제 무너진 집 256채만 놓고 보자. 이 중에 기둥이 썩은 집은 112채(=32+80)다. 따라서 어떤 집이 무너졌을 때 기둥이 썩어있을 확률은 112/256 = 약 44%다. 그러데 무너진 집을 조사해보니 쥐가 갉아먹은 흔적을 발견했다고 해보자. 아까는 기둥이 썩을 확률이 20%면 쥐가 갉아먹든 말든 20%였다. 그런데 집이 무너진 경우엔 다르다. 쥐가 갉아먹은 집은 112채 중에 기둥도 썩은 집은 32채이므로 확률은 32/112 = 약 29%가 된다. 그리고 쥐가 갉아먹지 않은 집 144채(=80+64) 중에 기둥이 썩은 집은 80채이므로 확률은 80/144 = 약 56%가 된다. 즉, 집이 무너진 것이 관찰된 경우에는 쥐가 갉아먹었느냐 마느냐에 따라 기둥이 썩어있을 가능성이 달라지는 것이다. <br />
<br />
이제까지 살펴본 베이즈 공 계산법을 이용해서 좀 더 복잡한 경우를 다뤄보자. 배우자가 수상한 행동을 하는 것이 관찰되었다. 배우자가 바람이 났을 수도 있고, 사실은 외계인이었을 수도 있다. 배우자가 외계인이라면 한밤 중에 집에 UFO가 찾아올 지도 모른다. 이걸 그래프 모형으로 그리면 아래와 같다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200909/29/94/a0007594_4ac1dfd3a42a1.png" width="448" height="417" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200909/29/94/a0007594_4ac1dfd3a42a1.png');" /></div>그럼 베이즈 공 계산법   <span style="color: rgb(204, 0, 0);">"하얀 원으로 연결되면 관련이 있고, 까만 원으로 연결되면 관련이 없다. 머리-대-머리면 반대."</span>에 따라 배우자가 바람난 것과 UFO가 집에 찾아오는 건 관련이 있게 된다. 따라서  배우자가 바람을 피우는 게 확실하다면, 우리는 한밤 중에 UFO가 찾아올 것을 걱정하지 않고 편안히 잠들 수 있다. <br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds17.egloos.com/pds/200909/29/94/a0007594_4ac1e0454a19b.jpg" width="475" height="475" onclick="Control.Modal.openDialog(this, event, 'http://pds17.egloos.com/pds/200909/29/94/a0007594_4ac1e0454a19b.jpg');" /></div><br />
<br />
<div style="text-align: center;"><font size="4">- 끝 -<br />
<br />
감사합니다</font><br />
</div><br/><br/>tag : <a href="/tag/통계학" rel="tag">통계학</a>,&nbsp;<a href="/tag/확률론" rel="tag">확률론</a>,&nbsp;<a href="/tag/그래프모형" rel="tag">그래프모형</a>			 ]]> 
		</description>
		<category>통계학</category>
		<category>확률론</category>
		<category>그래프모형</category>

		<comments>http://nullmodel.egloos.com/1953577#comments</comments>
		<pubDate>Tue, 29 Sep 2009 10:26:47 GMT</pubDate>
		<dc:creator>아이추판다</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 사랑과 고통 ]]> </title>
		<link>http://nullmodel.egloos.com/1952331</link>
		<guid>http://nullmodel.egloos.com/1952331</guid>
		<description>
			<![CDATA[ 
  <div style="border: 1px solid ; padding: 1em; background: ivory none repeat scroll 0% 0%; -moz-background-clip: border; -moz-background-origin: padding; -moz-background-inline-policy: continuous;">죽을 때조차도 '그들'보다는 '우리'에 속하는 편이 더 낫다. 1795년 런던의 켄싱턴 공원에서 루이스 애버쇼(Lewis Avershaw)라는 사람이 교수형을 당했다. 당시 사람들이 전하는 것처럼, 그는 교수대로 끌려가는 동안 지나치는 사람들과 담소를 나누고 입에 꽃을 문 채로 최후까지 당당하게 죽었다. 몇 달이 지나자 사람들은 그가 목매달린 장소를 마치 영웅의 무덤인 양 방문했다. 그는 영국인의 한 사람으로서, '우리' 중의 한 사람으로서 존경받으며 죽었다. 공개 교수형에 익숙했던 영국인들은 바로 그 점이 중요하다는 것을 알았다. 애덤 스미스(Adam Smith)도 1759년 "도덕감정론(Theory of Moral Sentiments)"에서 다음과 같이 말한 바 있다. "교수대로 향하는 사람은 자신을 지지하는 구경꾼들의 동정을 받으며...... 수치심에서 벗어나고, 자신의 고통이 혼자만의 것이라는 무엇보다 견디기 힘든 감정으로부터 벗어난다."<br />
<br />
데이비드 베레비, 정준형 옮김, "우리와 그들, 무리짓기에 대한 착각", 에코리브르, 303쪽.</div><br />
 사회적 지지(social support)는 실제로 고통을 감소시켜준다는 것은 여러 가지 실험으로도 잘 확인되어 있다. 오늘 새로 나온 논문중에 이 현상에 관련된 논문이 하나 있다.<br />
<br />
Master, S. L. et al. (2009). A Picture’s worth: Partner photographs reduce experimentally induced pain. <span style="font-style: italic;">Psychological Science</span>, ?(?), ?-?.<br />
<br />
실험은 이렇다. 6개월 이상 된 애인이 있는 여성들을 실험참여자로 모집했다. 실험자는 이 여성들의 팔 일부에 열을 가하면서 고통의 정도를 물었다. 실험의 조건은 여섯 가지였다.<br />
<br />
1) 애인이 손을 잡아주는 조건 <br />
2) 모르는 남자가 손을 잡아주는 조건 <br />
3) 고무공을 잡고 있는 조건 <br />
4) 애인의 사진을 보는 조건 <br />
5) 모르는 남자의 사진을 보는 조건<br />
6) 의자 사진을 보는 조건<br />
<br />
1, 2, 3의 조건에서 얼굴은 볼 수 없도록 두 사람 또는 고무공과 여성 사에 커튼을 쳤다. 동시에 실험참여자들은 불시에 삐 소리가 들리리면 버튼을 가능한 빨리 누르라는 지시도 받았다. 이것은 버튼을 누르는 속도를 측정해서 실험 조건에 따라 주의가 산만해진 것은 아닌지 알아보기 위해서다.<br />
<br />
실험 결과는 아래와 같다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200909/25/94/a0007594_4abc9198b86c6.png" width="493" height="444" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200909/25/94/a0007594_4abc9198b86c6.png');" /></div>위의 그래프는 각 조건에서 느낀 고통의 정도를 상대적으로 비교한 것이다. 왼쪽부터 실험 조건 1, 2, 3, 4, 5, 6에 해당한다. 무언가를 잡고 있는 조건에서는 애인, 고무공, 모르는 남자 순이고, 사진을 보는 조건에서도 마찬가지다. 다만 의자와 모르는 남자 사이에 별 차이는 없다. 그리고 애인의 손을 잡는 것보다 사진을 보는 편이 더 고통이 적었다. 연구자들은 사진을 보면서 애인으로부터 지지를 받고 있다고 상상할 수 있기 때문에 이런 결과가 나온 게 아닌가하고 추측한다. <br />
<br />
약간 신기하지만 아주 재밌진 않다. 결과가 반대로 나왔으면 대박이었을텐데 ㅎㅎ.<br />
<br/><br/>tag : <a href="/tag/심리학" rel="tag">심리학</a>,&nbsp;<a href="/tag/사회적지지" rel="tag">사회적지지</a>			 ]]> 
		</description>
		<category>심리학</category>
		<category>사회적지지</category>

		<comments>http://nullmodel.egloos.com/1952331#comments</comments>
		<pubDate>Fri, 25 Sep 2009 10:05:10 GMT</pubDate>
		<dc:creator>아이추판다</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 그림으로 보는 통계: (2) 쥐는 살찌고 사람은 굶는다 ]]> </title>
		<link>http://nullmodel.egloos.com/1951974</link>
		<guid>http://nullmodel.egloos.com/1951974</guid>
		<description>
			<![CDATA[ 
  <a target="_blank" href="http://nullmodel.egloos.com/1951581">그림으로 보는 통계: (1) 쥐와 사람의 관계</a><br />
<br />
여러분의 열화와 같은(?) 성원에 힘입어 계속되는 연재(먼산). 오늘의 주제는 꼬리-대-꼬리(tail-to-tail) 연결이다. 어느 순간 사람들의 입에 오르내린 "쥐는 살찌고 사람은 굶는다"라는 표어를 생각해보자. 이 표어에서 사람이 굶는 건 쥐가 살찌기 때문이 아니다. 이 두 가지는 "쥐가 쌀을 축낸다"라는 동일한 원인에서 초래된 결과다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds17.egloos.com/pds/200909/24/94/a0007594_4abb13e3b2699.png" width="378" height="334" onclick="Control.Modal.openDialog(this, event, 'http://pds17.egloos.com/pds/200909/24/94/a0007594_4abb13e3b2699.png');" /></div>다시 한 번 베이즈 공 계산법의 주문을 외워보자.  <span style="color: rgb(204, 0, 0);">"하얀 원으로 연결되면 관련이 있고, 까만 원으로 연결되면 관련이 없다. 머리-대-머리면 반대."</span> 쥐가 쌀을 축낸다는 사실이 관찰되기 전에는 "쥐가 살찐다"와 "사람이 굶는다"는 통계적으로 관련이 있다. <br />
<br />
쉽게 말해 여러 분이 어느 집에 갔는데 포동포동 살찐 쥐를 보았다고 해보자. 그러면 이 집 사람들은 굶주리고 있을거라고 추론해보는 것도 무리가 아니다. 물론 이 집이 부자집이라 쥐가 쌀독에 대운하를 파도 쌀이 넉넉하다면야 쥐가 살쪄도 사람은 굶지 않을 것이다. 언제나 그렇지만 논리학과 달리 통계학에서는 이럴 수도 있고 저럴 수도 있다. 하지만 그런 불확실성을 잘 '길들이는' 것이 통계학에서는 관건이 된다. <br />
<br />
그럼 이제 쥐가 쌀독에 들어앉아 소중한 쌀을 쳐묵쳐묵하고 있는 장면을 목격했다고 하자. <br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds17.egloos.com/pds/200909/24/94/a0007594_4abb13e4af67b.png" width="378" height="334" onclick="Control.Modal.openDialog(this, event, 'http://pds17.egloos.com/pds/200909/24/94/a0007594_4abb13e4af67b.png');" /></div><br />
그럼 이제 "쥐가 살찐다"와 "사람이 굶는다" 사이에는 관련이 없게 된다. 이것은 앞의 글에서 다룬 "머리-대-꼬리"와 같은 이유다. 간단히 말해 "쥐가 쌀을 축낸다"는게 목격된 이상 쥐가 살찌건 말건 사람이 굶는다는 사실에는 변함이 없게 되기 때문이다.<br />
<br />
이것만으로는 좀 싱거우니까 이런 아이디어가 실제 통계분석법에서 어떻게 나타나는지 잠깐 살펴보자. 시험 점수를 바라보는 관점에는 두 가지 편향이 있다. 하나는 시험 점수가 그 자체로 실력을 반영한다고 보는 관점이고, 또 하나는 시험 점수는 시험 점수일 뿐 실력이 아니라는 관점이다.<br />
<br />
그런데 한 사람이 여러 번 시험을 보면 시험마다 점수는 다를지언정 대체로 관련이 있다는 걸 알 수 있다. 저번 시험에 80점 맞은 사사람은 이번 시험에서 75점이나 85점을 맞기도 하지만 그렇다고 30점을 맞는 경우는 드물다. 반대로 저번 시험에 50점을 맞은 사람이 갑자기 90점을 맞는 경우도 드물다. 오늘 소개한 꼬리-대-꼬리의 연결로 이를 모형화해보자.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200909/24/94/a0007594_4abb16a31b4c1.png" width="331" height="334" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200909/24/94/a0007594_4abb16a31b4c1.png');" /></div>우리는 어떤 경우에도 실력 그 자체를 관찰할 수는 없다. 우리가 관찰할 수 있는 것은 시험 점수들 뿐이다. 위의 모형에서 시험 점수들은 관찰되지 않은 변수인 '실력'에 의해 꼬리-대-꼬리로 연결되어 있으므로 서로 관련이 있게 된다.  이제 우리는 실제 자료를 가지고 그렇게 관련이 있는지 검증할 수 있다.<br />
<br />
이런 논리에 바탕을 둔 통계 분석법을 "요인 분석(factor analysis)"이라고 한다. 요인 분석은 우리가 관찰할 수 있는 현상들 사이에 관찰할 수 없는 공통 원인이 있다고 가정한 다음, 그런 가정에 바탕해서 위와 같은 모형을 세우고 이를 검증하는 것이다.<br />
<br />
요인 분석은 원래 스피어만이라는 심리학자가 일반 지능(general intelligence)의 존재를 검증하기 위해 만든 것이다. 스피어만은 여러 종류의 다른 시험 점수들 사이에 상관 관계가 나타나는 것을 보고, 서로 다른 종류의 지적 작업에 공통적으로 관여하는 일반 지능이 있다고 생각했다. <br />
<br />
사람을 컴퓨터에 비교해서 설명하자면 그래픽 카드나 랜 카드 같은 것의 성능이 특수한 재능이고 CPU 성능이 일반 지능이 되는 것이다. 사실 CPU 성능도 정확하게 측정할 방법이 없기 때문에, 일반 지능도 확실하게 측정할 방법은 없지만 요인분석 등의 통계적 방법으로 대략 추정은 할 수 있다.<br />
<br />
일반지능이론에 반대하는 다중지능이론이나 모듈론 같은 것도 있지만 스피어만의 이론은&nbsp; 오랫동안 많은 심리학자들이 지지해왔고 여전히 교육이나 인사 등 실무 영역에서는 널리 활용되는 개념이다. 스피어만 이후에 발전된 모형을 단순화시키면 아래와 같다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200909/24/94/a0007594_4abb1a1124cc0.png" width="406" height="477" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200909/24/94/a0007594_4abb1a1124cc0.png');" /></div>물론 수학이나 과학시험도 언어능력의 영향을 받기는 하겠지만 그냥 간단히 그렸다. 미국의 수능인 SAT는 이런 지능 이론에 바탕을 둔다. 지능에는 크게 유동 지능(fluid intelligence)와 결정 지능(crystalized intelligence)이 있고, 유동 지능의 대표적인 것이 일반 지능이다. 결정 지능은 간단히 말해 경험적으로 축적된 지식을 말한다. 그래서 SAT 1은 유동 지능을 측정하는 검사로 언어영역과 수리영역, 에세이로 이뤄져있고, SAT 2는 결정 지능을 측정하는 검사로 과목별 지식을 측정한다. 한국의 수능도 SAT 1과 비슷한 구조를 가지고 있다. 수능에서 사회와 과학 시험을 좀 생뚱맞게도 "수리탐구2"라고 부르는 것은 이런 이유 때문이다. <br />
<br />
다음은 대망의 "머리-대-머리" (계속)<br />
<br/><br/>tag : <a href="/tag/통계학" rel="tag">통계학</a>,&nbsp;<a href="/tag/확률론" rel="tag">확률론</a>,&nbsp;<a href="/tag/그래프모형" rel="tag">그래프모형</a>			 ]]> 
		</description>
		<category>통계학</category>
		<category>확률론</category>
		<category>그래프모형</category>

		<comments>http://nullmodel.egloos.com/1951974#comments</comments>
		<pubDate>Thu, 24 Sep 2009 07:21:45 GMT</pubDate>
		<dc:creator>아이추판다</dc:creator>
	</item>
	<item>
		<title><![CDATA[ 그림으로 보는 통계: (1) 쥐와 사람의 관계 ]]> </title>
		<link>http://nullmodel.egloos.com/1951581</link>
		<guid>http://nullmodel.egloos.com/1951581</guid>
		<description>
			<![CDATA[ 
  <a target="_blank" href="http://nullmodel.egloos.com/1949769">통계 얘기</a>가 나온 김에 뭔가 재밌는(?) 통계 이야기. <br />
<br />
"넘버스(Numbers)"라는 미국 드라마가 있다. 수학자가 FBI를 도와 범죄 해결을 한다는 이야기다. 이 드라마에서 나오는 수학 기법 중에 상당수가 통계학에 속한다. 당연한 일이다. 불확실성이 포함된 데이터를 가지고 그 아래서 패턴을 읽어내는 게 통계학이기 때문이다. 이런 이유 때문에 통계학은 범죄 수사만이 아니라 학문 연구, 정책 결정, 여론 조사 등 많은 분야에서 사용되고 있다. <br />
<br />
그런데 통계학은 19세기에 시작된 최신 분야다. 나이가 들어 눈이 먼 후에도 암산만으로 논문을 썼다는 18세기의 위대한 수학자 오일러도 "데이터는 적을 수록 좋다"고 생각했다고 한다. 그만큼 통계학을 직관적으로 이해하기는 어렵다. 내가 오일러에 비할만한 사람은 아니지만 그래도 10년 가까이 통계를 공부했는데 아직도 간단한 개념이 헷갈려서 책을 찾아볼 때가 있다.<br />
<br />
나만 그런 것은 아닌지 통계학자들도 통계의 핵심적 아이디어를 직관적으로 표현할 방법을 여러 가지 생각해냈다. 오늘 소개할 "유향 그래프 모형(directed graphical model)" 또는 "베이지언 네트워크(Bayesian network)"가 그  예다. 이 글에서는 그냥 '그래프 모형'이라고 부르겠다.<br />
<br />
그래프 모형은 무시무시한 이름과 달리 내용은 아주 간단하다. 동그라미와 화살표만 알면 된다. 한 가지 예를 들어보자. 비가 오면 땅이 젖는다. 어느 날 아침 집을 나서니 땅이 젖어있다. 비가 왔나?하며 하늘을 한 번 본다. 이 상황을 그래프 모형으로 나타내면 아래와 같다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200909/22/94/a0007594_4ab7a56a8e639.png" width="435" height="162" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200909/22/94/a0007594_4ab7a56a8e639.png');" /></div>비는 올 수도 있고 안 올 수도 있다. 땅은 젖을 수도 있고 안 젖을 수도 있다. 그래프 모형에서 이런 변수들은 원으로 그린다. 그리고 이 변수들 사이의 관계는 화살표로 그린다. 비가 오면 땅이 젖지, 땅이 젖으면 비가 오는 건 아니니까 '비가 왔다'에서 '땅이 젖었다'로 화살표를 긋는다. 마지막으로 우리가 실제 목격한 건 땅이 젖었다는 것 뿐이니까 땅이 젖었다는 까맣게 칠하고, 비가 왔다는 속이 빈 원으로 그린다. 참 쉽죠?<br />
<br />
그래프 모형은 이렇게 확률적인 관계들을 알기 쉽게 나타내주는 것이다. 그런데 그리는 방법이 너무 간단해서 헛웃음이 나온다. 이걸로 우리가 알 수 있는 게 뭐가 있냐. 그래서 오늘은 역시 간단하면서도, 다른데 써먹기도 좋고, 애인과 카페에서 차마시다가 냅킨에 그려서 가르쳐주면 폼도 나는(과연?) 그래프 모형의 활용법 하나를 알려주겠다.<br />
<br />
비가 오면 땅이 젖는다. 땅이 젖는 건 꼭 비 때문 만은 아니지만 땅이 젖어있다면 비가 왔을 가능성이 높다. 즉, 화살표의 방향이야 어떻든 화살표로 연결된 두 변수는 서로 '관련'이 있다. 독립이니 종속이니 하는 통계학 용어는 몰라도 된다. 그러면 저렇게 여러 가지 변수가 얽히고 섥혀 있을 때 직접 연결되어 있지는 않지만 건너 건너 연결된 변수들은 어떨까?<br />
<br />
이걸 따져보는 방법이 '베이즈 공 계산법(Bayes ball algorithm)"이다. 그래프 모형도 그렇지만 이것도 이름만 거창하지 내용은 별 거 없다. 이 계산법은 아주 간단하다. <span style="color: rgb(204, 0, 0);">"하얀 원으로 연결되면 관련이 있고, 까만 원으로 연결되면 관련이 없다. 머리-대-머리면 반대."</span> 무슨 주문 같지만 하나씩 예를 들어 설명을 해보자.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds17.egloos.com/pds/200909/23/94/a0007594_4ab9baa927b96.png" width="500" height="141.608391608" onclick="Control.Modal.openDialog(this, event, 'http://pds17.egloos.com/pds/200909/23/94/a0007594_4ab9baa927b96.png');" /></div>집에 쥐가 살면 쌀이 축날 가능성이 높다. 쌀이 축나면 사람이 굶을 가능성이 높다. 위의 그래프 모형은 이 상황을  명쾌하게 정리하고 있다. 그림을 잘 보면 "쌀이 축난다"의 왼쪽에는 화살표의 '머리'가 붙어있고, 오른쪽에는 화살표의 '꼬리'가 붙어있다. 이걸 '머리-대-꼬리(head-to-tail)'라고 한다. <br />
<br />
"집에 쥐가 산다"와 "사람이 굶는다"는 "쌀이 축난다"를 통해 간접적으로 연결되어 있다. 우리의 '주문'에서 "하얀 원으로 연결되면 관련이 있다"는 게 이 뜻이다.&nbsp; 어렵게 생각해보지 않아도 집에 쥐가 사는 것과 사람이 굶는 것 사이에는 당연히 관련이 있다. 그럼 이번엔 "쌀이 축난다"가 관찰된 경우를 생각해보자.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds16.egloos.com/pds/200909/23/94/a0007594_4ab9c9b8bcde8.png" width="500" height="141.608391608" onclick="Control.Modal.openDialog(this, event, 'http://pds16.egloos.com/pds/200909/23/94/a0007594_4ab9c9b8bcde8.png');" /></div>이제 "집에 쥐가 산다"와 "사람이 굶는다"는 까만 원으로 연결되었다. 그러면 둘 사이에는 관련이 없다.  이해가 잘 안 갈 수도 있는데 이렇게 생각을 해보자. "집에 쥐가 산다"는 것이 "사람이 굶는다"에 영향을 주는 건 어디까지나 "쌀이 축난다"를 통해서다. 그런데 어떤 이유에서건 쌀이 축난다는 게 확인된 이상 집에 쥐가 살건 말건 사람이 굶는다는 점에는 변함이 없다.<br />
<br />
물론 "그 쥐를 잡으면 사람은 더 굶지 않을 게 아닌가?"하고 반문할 수도 있다. 그런데 쥐를 잡으면 위의 그래프의 관찰 상태가 달라진다. "집에 쥐가 산다"는 관찰된 상태로 바뀌고, "쌀이 축난다"는 관찰되지 않은 상태로 바뀐다. 쥐가 없어도 도둑이 쌀을 훔쳐갈 수도 있고, 벌레가 쌀을 축낼 수도 있기 때문이다. 그러면 다시 "집에 쥐가 산다"와 "사람이 굶는다"는 하얀 원으로 연결되기 때문에 관련이 있게 된다.<br />
<br />
별로 한 이야기도 없는데 글이 길어졌다. "꼬리-대-꼬리"와 "머리-대-머리"의 경우는 다음 글에서 다루도록 하겠다.<br />
<br />
<div style="text-align:center"><img class="image_mid" border="0" onmouseover="this.style.cursor='pointer'" alt="" src="http://pds15.egloos.com/pds/200909/23/94/a0007594_4ab9cd782dc62.png" width="329" height="184" onclick="Control.Modal.openDialog(this, event, 'http://pds15.egloos.com/pds/200909/23/94/a0007594_4ab9cd782dc62.png');" /></div><br/><br/>tag : <a href="/tag/통계학" rel="tag">통계학</a>,&nbsp;<a href="/tag/확률론" rel="tag">확률론</a>,&nbsp;<a href="/tag/그래프모형" rel="tag">그래프모형</a>			 ]]> 
		</description>
		<category>통계학</category>
		<category>확률론</category>
		<category>그래프모형</category>

		<comments>http://nullmodel.egloos.com/1951581#comments</comments>
		<pubDate>Wed, 23 Sep 2009 07:26:33 GMT</pubDate>
		<dc:creator>아이추판다</dc:creator>
	</item>
</channel>
</rss>
