search engine ; 검색엔진

검색엔진이란 무엇인가? | 어디부터 먼저 찾아볼 것인가? | 주요 검색엔진들과 동작원리 | 검색하는 절차

검색엔진이란 무엇인가?

인터넷 상에서 검색엔진은 다음과 같이 세 부분으로 나뉜다:

  • 검색되어지길 원하는 각 페이지 또는 모든 웹사이트의 대표 페이지로 가서 그것을 읽고, 각 페이지 상의 하이퍼텍스트 링크를 사용하여 그 사이트의 다른 페이지들을 읽어 오는 스파이더 (때로는 "크롤러(crawler)" 또는 "(bot)" 이라고도 불림)라는 프로그램
  • 읽어들인 웹페이지에 대해 거대한 색인(때로 이것을 "카탈로그"라고도 부른다)을 만드는 프로그램
  • 사용자의 검색요구를 받아들이고, 색인 내에 있는 내용과 비교한뒤, 검색 결과를 돌려 주는 프로그램

검색엔진을 사용하는 또다른 방법은 주제별 구조를 갖는 디렉토리를 탐색하는 것이다. 야후는 검색엔진을 사용할 수도 있지만, 웹 상에서 가장 널리 사용되는 디렉토리 검색사이트이다. 많은 수의 웹 포탈사이트들이 정보를 찾기위해 검색엔진과 함께 디렉토리 방식을 제공한다.

어디부터 먼저 찾아볼 것인가?

자신들만의 고유한 검색엔진을 가진 주요 웹사이트들이 8개 정도 있다. 야후와 같은 사이트들은 자신의 검색 엔진을 사용하는 것 뿐 아니라, 다른 사이트의 색인으로부터 얻어진 검색결과를 함께 제공한다. 다중 색인들로부터 동시에 검색할 수 있는 사이트들은 다음과 같다.

야후는 먼저 자신의 구조화된 주제 디렉토리를 찾고 거기에 있는 내용들을 제공한다. 그리고는 알타비스타 검색엔진으로부터 검색된 결과중 일부를 제공한다. 또한 사용자의 검색조건에 맞는 결과를 찾기위한 검색요구를 6~7개의 다른 주요 검색엔진에 동시에 내보낸다. 사용자는 야후의 검색결과를 보여주는 웹 페이지 하단 부의 링크를 통해 각 검색엔진으로 가서 검색결과를 확인할 수 있다.

야후 검색의 가장 큰 장점은 사용자가 야후 내의 어떤 목록 내에 있다면, 사용자가 찾고자 하는 웹사이트 또는 그 검색조건과 관련이 있는 사이트들의 전체 목록으로 이끌어 나갈수 있는 가능성이 높다는 것이다.

서치콤은 기본적으로 인포시크(Infoseek)의 색인을 먼저 찾지만, 다른 주요 검색엔진 역시 검색할 수 있도록 해준다.

이지서처는 사용자가 여덟 개의 저명한 검색엔진 중 하나를 선택할 수 있도록 하거나, 여러 개의 검색 필드 내에 특화된 검색엔진 또는 데이터베이스의 매우 포괄적인 목록을 제공한다.

야후나 서치콤, 그리고 이지서처 모두 사용자가 검색구문을 입력하기 쉽게 도움말을 제공한다. 대부분의 웹 포탈 사이트들은 주요 검색엔진으로 빠르게 접속할 수 있도록 검색구문을 직접 입력할 수 있는 검색 창을 제공한다.

주요 검색엔진들과 동작원리

주요 웹 검색엔진들은 다음과 같으며, 이외에도 이지서처(http://www.easysearcher.com/)에는 특화된 많은 검색엔진들이 등재되어 있다.


대부분의 대형 검색엔진들은 가급적 웹 상에 있는 정보를 모두 색인하기 위한 노력을 경주하는데, 일단 어떤 사이트의 웹페이지가 색인되고 나면, 검색엔진은 주기적으로 그 사이트에 다시 방문하여 색인내용을 수정한다.

몇몇 검색엔진들은 다음과 같은 항목에 특별한 가중치를 두어 색인한다.

그러나 각 검색엔진들은 다소 다른 색인기법과 탐색기법을 사용하고 있으며(이 또한 해당기업의 고유 비밀로 간주되는 경향이 있다), 또한 각 검색엔진은 이러한 기법을 언제라도 바꿀 수 있기 때문에, 그것에 관해서 여기에 깊이 설명하지 않았다.

검색하는 절차

검색조건를 잘 입력하는 방법을 알기 위해, 각 검색엔진에서 제공하는 정보를 적어도 한번 쯤은 읽어두는 것이 좋을 것이다.

'검색하는 절차'이라는 제목을 붙이긴 했지만, 여기서 다루려는 것은 검색에 관한 일반적인 접근방식들이다. 즉, 먼저 시도해 보야야할 것이나, 얼마나 많은 검색엔진을 사용해야 하는지, 유즈넷뉴스그룹을 검색해야 하는지 여부, 그리고 언제 검색을 끝내야 하는지 등과 같은 것들 말이다. 그것은 물론 일반화하기 어렵지만, 그래도 많이 권장되는 접근방식이라고 이해해 주기 바란다.

  1. 먼저 구글을 써보라. 그러면 검색조건에 가장 잘 부합하는 순서에 따라 검색 결과를 받게 되는데, 그것이 바로 당신에게 필요한 전부일 수도 있다.
  2. 만약, 구글에 아무 것도 나타나지 않거든, 야후, 알타비스타, 엑사이트, 핫봇, 라이코스 그리고 그 밖의 다른 검색엔진을 차례로 이용해 보라. 그 검색이 얼마나 중요한지에 따라 다르긴 하겠지만, 보통 검색결과로 제시되는 목록 중에서 상위 20개의 내용 이하로 찾아갈 필요는 없다.
  3. 만약 당신이 철저한 검색을 하고 있는 중이라면 (학위논문을 위해 주변상황을 모두 수집해야하는 경우 등), 이지서처2를 통해 접근이 가능한 특화 데이터베이스들을 이용해 보라.
  4. 만약 이 시점에서도 찾는 것을 발견하지 못했다면, 검색을 위해 주제 디렉토리를 사용하는 것을 고려해 보라. 야후나 다른 구조화된 주제분류의 조직을 보고, 당신이 찾는 용어나 구절이 들어 있을 법한 분류로 계속해서 좁혀나갈 수 있는지를 확인하라. 설령 여기서 아무 것도 찾지 못했더라도, 당신은 이 방법을 통해 검색구문에 관한 새로운 아이디어를 얻을수 있을지도 모른다.
  5. 만약 필요하다고 느껴지면, 웹뿐 아니라 유즈넷 뉴스그룹도 함께 검색하라.
  6. 베로니카나 저그헤드를 이용하여 고퍼사이트를 검색하고, FTP 사이트를 검색하기 위해 아키를 사용하는 것도 고려하라. 특화된 데이터베이스를 위해 WAIS와 같은 것의 사용도 필요하게 될지 모른다.
  7. 검색을 계속하면서, 검색문구에 대해 계속해서 다시 생각해 보라. 사용할 수 있는 무슨 다른 방법은 없는지? 당신이 진정 원하는 것으로 이끌어 줄 수 있는 관련되는 주제는 혹 없는지?
  8. 마지막으로, 혹시 당신이 찾는 주제가 너무 새로워서 아직 인터넷상에서 쉽게 찾을 수 없는 것인지에 관해 생각해 보라. 만약 그렇다면, 당신은 아주 최신판의 컴퓨터인터넷 잡지를 찾아보던가, 아니면 그 주제에 대해 연구하거나 개발에 참여할 것 같다고 생각되는 회사를 방문하는 편이 나을지 모른다.

우리나라의 주요 대형 검색엔진의 주소는 다음과 같다.


작성 : 99-08-01 수정 : 04-02-18
영어판(whatis.com)