다른 인터넷이 가능하다 3: 나는 네가 무엇을 검색했는지 알고 있다

[box type=”note”] ‘프리즘(PRISM)’ 사건은 감시사회의 공포를 현실화했습니다. 함께하는시민행동 정보인권국과 슬로우뉴스가 공동기획으로 감시와 독점에서 벗어난 자유롭고, 다양한 인터넷 대안을 함께 고민합니다. 본 연재는 총 8회에 걸쳐 진행할 예정입니다. (편집자) [/box]

식상한 표현이지만 인터넷을 흔히 정보의 바다로 비유하곤 한다. 상상할 수 없을 정도로 많은 양의 정보를 찾을 수 있는 인터넷. 그렇다면 이렇게 많은 정보들 중에서 자신이 원하는 정보를 찾기 위해서 어떤 일을 할 수 있을까? 아마 백이면 백 검색 사이트를 이용할 것이다. 우리는 인터넷을 이용하며 자연스럽게 검색 사이트를 이용한다. 필요한 정보를 찾기 위해서일 수도 있고, 또는 원하는 사진 등을 보기 위해서나 또는 접속하고자 하는 사이트로 이동하기 위해서도 검색 사이트를 사용한다.

갈수록 강력해지는 검색 기능 때문에 검색 사이트에서 개인 정보들이 줄줄이 검색되는 일이 벌어져 논란이 되었지만, 전 세계 검색의 ‘끝판왕’으로 칭송받는 구글과 우리나라에서 가장 많이 네이버에서 사용자의 IP주소와 쿠키, 사용 일시, 사용 기록 등이 자동으로 생성되어 수집되고 있다는 사실을 아는 사람은 많지 않다. (구글 개인정보취급 방침 / 네이버 개인정보취급 방침)

쿠키는 지난 브라우저 관련 글에서도 언급했지만, “사용자가 어떤 웹사이트를 방문할 때 그 사이트 서버에서 인터넷 사용자의 컴퓨터에 설치하는 작은 기록 정보 파일”이다. 쿠키가 IP주소 등과 결합하였을 때는 사용자 자신을 특정할 수 있는 위험이 있다. 게다가 사용 일시나 사용기록까지 수집된다. 그 때문에 프리즘(PRISM) 사건에서 보듯 내가 언제 무엇을 검색했고 어떤 사이트를 갔는지 등이 그대로 정부기관 등에 수집될 수 있는 것이다. 특히나 우리나라 같은 경우 검색 사이트 대부분이 포털 형태로 되어 있어 가입하게 되면 가입정보와 더불어 엄청난 개인정보가 해당 사이트에 축적된다.

특별히 이상한 내용들을 검색하지 않는다고 하더라도 개인의 검색 기록 등이 누군가에 의해 감시받을 수 있다고 생각하면 기분이 썩 좋지는 않을 것이다. 그렇다면 검색 기록을 남기지 않고, 프라이버시 보호 관련 기능을 갖추고 있는 검색 엔진은 없을까?

IP와 사용기록을 수집하지 않는다

1. 스타트페이지(start page): 사생활 보호용 구글?

스타트페이지(StartPage)는 구글의 검색 결과를 제공해주는 검색 사이트로 IP 주소, 사용자 컴퓨터의 운영체제나 브라우저 종류 등을 수집하지 않으며 쿠키도 최소한인 익명의 환경설정 관련 부분만 수집하는 검색 사이트이다. 검색 사이트에서 수집되는 내용들이 심각한 프라이버시 침해를 일으킬 수 있다는 문제인식에서 시작되어 2009년 1월 이후 더는 IP주소를 수집하지 않고 있으며 스타트페이지의 개선이나 문의 등에 사용된 사용자의 이메일 주소 등도 절대 타사와 공유하거나 거래하지 않는다.

물론 스타트페이지를 이용하여 다른 사이트에 접속한다고 하더라도 스타트페이지가 아닌 다른 사이트에서 수집되거나 기록되는 정보는 어쩔 수 없다. 하지만 스타트페이지를 통한 타 사이트 접속 기록 자체는 스타트페이지에 남지 않게 된다. 즉 계속 스타트페이지를 통해서만 웹서핑을 하게 된다면 자신의 프라이버시를 보호하면서 서핑할 수 있다.

2. 덕덕고(DuckDuckGo): 프라이버시 보호를 앞세운 검색서비스

DuckDuckGo 메인 화면 — 덕덕고(DuckDuckGo) 메인 화면

최근에는 프라이버시 보호를 앞세운 검색엔진 서비스인 ‘덕덕고'(DuckDuckGo) 또한 주목받고 있다. 덕덕고는 프리즘 폭로된 이후 이용이 많이 늘어나고 있으며 이용자의 프라이버시를 보호하는 검색엔진이라는 점에서 주목받고 있다.

덕덕고는 2007년 만들어졌으며 이 역시 사용자의 검색 기록, IP주소, 쿠키 정보를 저장하지 않는다. 또한, 사용자의 설정에 의해 저장되는 정보 역시 암호화해서 저장하는 등 검색에 있어 프라이버시를 보호하는데 초점을 두고 있다. 이러한 까닭에 외부에서 덕덕고의 사용자 검색기록을 분석해도 누가 무엇을 검색했는지 확인하는 것이 불가능하다. 다만 ‘덕덕고’로도 검색을 하다 보면 광고 노출이 이루어지는데, 이는 개인정보에 기반을 둔 것이 아닌 철저히 검색 키워드 연관성을 고려한 광고만을 노출한다고 한다.

P2P 방식의 분산화된 검색엔진

1. 야시: P2P 방식의 분산화된 검색 엔진

YaCy 검색 결과(출처: Wikimedia Commons) — 야시(YaCy) 검색 결과

검색 엔진 ‘야시'(YaCy)는 검색에 관한 접근 방식이 구글이나 네이버 뿐만 아니라 위에서 언급한 스타트페이지, 덕덕고와도 차별된다. 야시는 중앙 서버를 사용하는 대신 야시 소프트웨어를 다운받은 사용자들의 컴퓨터에 각각의 독립 피어(peer)들의 네트워크가 검색 결과로 나타난다. 즉, 중앙 서버에 있는 데이터를 검색 결과로 보여주는 것이 아니라 각 사용자들이 방문했던 웹페이지를 색인하고 사용자와 사용자 사이를 바로 연결하여 색인된 웹페이지를 검색의 결과물로 보여주는 방식이다. 이러한 방식의 검색엔진은 웹서핑의 일상적 행위인 검색을 거대 IT 기업에 의존하는 것에 대한 문제 제기에서 시작되었다. 앞서 언급했던 개인정보의 수집 문제뿐만 아니라 검색결과를 해당 검색엔진을 제공하는 거대 IT 기업의 의도에 따라 달리 제공될 수 있는 문제 등을 야기할 수 있기 때문이다. 기본적으로 야시는 오픈소스 소프트웨어이며 누구나 사용하고 연구하며 개선할 수 있다.

2. 시크스 프로젝트(Seeks Project)

야시와 유사한 형태로 검색 결과를 제공하는 검색엔진 프로젝트가 진행되고 있는데 바로 ‘시크스 프로젝트'(Seeks Project)다. 검색할 때 쓰는 언어를 질의어 또는 조회라고 표현하는데 이와 관련해 ‘쿼리'(query)라는 용어를 많이 쓴다. 흔히 어떤 검색 사이트를 많이 사용하는지 통계를 낼때 ‘구글은 몇억 쿼리, 덕덕고는 몇 백만 쿼리를 수신했다’ 라고 표현하는데 쉽게 말해 사용자가 검색 사이트에서 얼마나 검색어를 입력했느냐 정도로 이해할 수 있겠다.

시크스 프로젝트는 이러한 쿼리 정보나 쿼리에 의한 결과물, 주로 일반적으로 사용하는 구글이나 빙(Bing) 또는 SNS에서의 결과물을 공유하여 좀 더 유의미한 검색 결과를 보일 수 있도록 노력한다. 또한, 개인정보 보호를 위해 쿼리는 암호화해서 사용자끼리 공유할 수 있게 했다. 시크스 프로젝트는 비슷한 쿼리들에 의해 검색된 결과물을 재편성하여 다른 사용자와 비슷한 내용을 검색했을 때 타 사용자가 검색한 콘텐츠들을 추천할 수 있도록 해준다. 그리고 이 단계에서 반드시 다른 사용자의 검색 결과물을 참고해야 하는 것은 아니며 반수동으로 다른 사용자의 결과물을 클릭하는 방식으로 추천하게 한다. 시크스 프로젝트는 현재 리눅스에 기반을 둔 운영체제인 데비안(Debian)이나 우분트(Ubuntu)에서 제공되고 있다.

대안 검색 서비스의 경쟁력이 생기면?

앞서 소개했던 스타트페이지나 덕덕고는 구글의 인터페이스와 크게 다르지 않다. 따라서 네이버 등 국내 검색사이트를 많이 사용하는 일반 사용자에게는 검색결과가 낯설어 보일 수 있겠지만, 사용 자체에 크게 어려움은 없다. 검색 사이트 자체에서 IP주소나 검색 기록, 사용자 기기정보 등을 수집하지 않는다고 하니 인터넷 감시를 우려한다면 크게 환영할 만한 사이트다.

야시나 시크스 프로젝트도 주목할 만하다. 알아서 유의미한 결과물을 주르륵 정렬해주는 친절해보이는 검색 엔진은 아니지만, 사용자끼리 직접 검색 결과물을 공유하고 개인정보가 특정 사이트에 흘러들어갈 우려가 없기에 이러한 형식들의 검색 엔진이 조금만 더 사용자에게 친절해진다면 한때 P2P 자료 공유 사이트가 유행했던 것처럼 경쟁력을 가질 수 있지 않을까 생각한다.

기존 검색엔진에서 IP, 쿠키, 사용기록, 방문기록 등의 수집이 사용자에게 맞춤형 서비스를 제공하겠다는 명목하에 실제로는 프라이버시 침해를 일으키고 있을지 모를 일이다. 더군다나 공공기관에서 이러한 정보를 열람하여 개인을 감시할 수 있다고 한다면 정말 끔찍한 일이다.

인터넷 서비스를 쓸 때 사용자가 누릴 편의 정도와 사용자가 제공할 개인 정보는 선택 가능해야 한다. 구글이나 네이버 같은 기존 검색 사이트에서는 이런 선택이 사실상 불가능하다(단, 몇몇 수고를 감수하면 쿠키 수집을 막을 수는 있다). 검색 사이트의 과도한 정보 수집에 대한 문제 제기가 꾸준하게 이뤄지고, 대안 검색엔진 사용이 늘어난다면 기존 검색 엔진도 프라이버시 보호와 편의성이 긍정적으로 변화할 수 있으리라 기대한다.

지금까지 대안 검색 서비스를 살펴봤다. 다음 글에서는 카카오톡 PC버젼 출시로 또 한 번 불거진 메신저의 개인정보 수집문제에 비추어 기존의 구글톡이나 네이트온 등의 PC 메신저 서비스를 대신할 수 있는 대안 메신저를 소개하고자 한다.

[box type=”info” head=”다른 인터넷이 가능하다 “]
1. 운영체제 편: 독점 없는 착한 운영체제
2. 웹 브라우저 편: 내 소중한 사생활을 보호하는 웹 브라우저
3. 검색 편: 나는 네가 무엇을 검색했는지 알고 있다
4. 메신저 편: 카톡이 불안할 때? 다양한 대안 메신저들!
5. 소셜서비스 편: 페이스북, 넌 내 개인정보를 지나치게 좋아해!
6. 클라우드 서비스 편: 클라우드에 보관한 내 정보, 과연 안전할까?
7. 출판 플랫폼 편: 내가 주인인 1인 미디어 만들기
8-1. 이메일 편: 이메일 속 내 비밀을 지키고 싶다면
8-2. 이메일 클라이언트 편: ‘아웃룩’ 대신할 이메일 클라이언트 [/box]