3.1-6. Perplexity Comet을 활용한 코딩 없는 웹 크롤링 실습

Perplexity Comet 코딩 없는 웹 크롤링 실습 가이드

Perplexity Comet 코딩 없는 웹 크롤링 실습 가이드

1. Perplexity Comet 기본 이해

크롤링 개념: 웹페이지를 탐색하여 데이터를 수집하는 행위. 웹을 기어 다니며 정보를 모으는 것에서 유래.
Perplexity Comet 이점:
파이썬 등 프로그래밍 언어 없이 구어체 명령만으로 웹 크롤링 가능.
SNS 등 기존 크롤링이 까다로운 사이트에서도 효과적 활용 가능.
접근 방법: Perplexity 유료 사용자만 이용 가능하며, 무료 체험 링크를 통해 사용 권장.
기술 기반: Google Chrome 기반 오픈소스와 '어시스턴트' 기능 결합.

2. 웹페이지 기본 정보 수집

목표: 특정 검색 결과 페이지의 상위 블로그 제목 크롤링.
실습 단계:
1.
Perplexity Comet 브라우저에서 원하는 검색 결과 페이지(예: 네이버 '홍대 맛집' 검색 결과)로 이동.
2.
'어시스턴트' 기능 활성화.
3.
다음과 같이 질문 입력.
이 페이지의 상위 10개 블로그 제목은?
💬
Comet

3. 페이지 내부 정보 심층 분석 및 요약

목표: 개별 게시글의 내용 파악 및 요약.
실습 단계:
1.
상위 블로그 제목 크롤링 후, '어시스턴트' 기능 활성화.
2.
다음과 같이 요청 입력.
10개의 글들은 각각 어떤 내용을 다루고 있는지 클릭해서 알아보고 글머리 기호 3개로 각각 요약해 줘.
3.
Comet이 각 게시글을 직접 방문하여 내용을 분석하고 요약 제공.
a.
단점: 직접 방문/검색하는 데에 시간 소요
💬
Comet

4. 뉴스 기사 분석 및 정보 정리

목표: 뉴스 기사 목록을 특정 형식에 맞춰 정리.
실습 단계:
1.
Google에서 특정 주제(예: "챗 GPT") 검색 후 뉴스 탭으로 이동.
2.
'어시스턴트' 기능 활성화.
3.
다음과 같이 요청 입력.
이 페이지에 있는 기사를 아래와 같이 정리해 줘 - 번호 - 기사 제목 - 언론사 - URL - 한 줄 요약 - 긍정/부정
4.
Comet이 빠르고 정확하게 뉴스 정보를 추출하여 정리 제공.
💬
Comet

5. 소셜 미디어 게시물 분석

목표: 인스타그램 게시글의 주요 내용 및 해시태그 분석.
실습 단계:
1.
분석하고자 하는 인스타그램 게시글 페이지로 이동. > i.e. 농심
2.
'어시스턴트' 기능 활성화.
3.
다음과 같이 요청 입력.
상위 9개의 게시글을 분석해 줘. 주요 내용, 해시태그를 정리해서 알려 줘.
4.
Comet이 인스타그램 게시물의 핵심 내용을 분석하여 제공.
💬
Comet

6. 댓글 내용 분석 및 요약

목표: Youtube 영상 댓글의 주제 분류 및 요약.
실습 단계:
1.
댓글이 있는 영상 페이지로 이동. > i.e. CNN 뉴스
2.
'어시스턴트' 기능 활성화.
3.
다음과 같이 요청 입력.
이 영상의 댓글을 주제를 정해서 나누고 요약해 달라.
4.
Comet이 댓글 내용을 분석하여 주제별 요약 제공.
💬
Comet

7. 스크린샷 이미지 내 텍스트 분석 및 시각화

목표: 스크린샷 내 텍스트 정보를 그래프로 시각화.
실습 단계:
1.
웹페이지에서 스크린샷 기능을 사용하여 특정 내용을 드래그하여 선택.
2.
'어시스턴트' 기능 활성화.
3.
다음과 같이 요청 입력.
이 내용을 그래프로 그려 줘.
4.
Comet이 선택된 정보를 바탕으로 그래프 생성 (Perplexity의 파이썬 코딩을 통해 시각화).
💬
Comet

8. 멀티 창/탭 분석하기

여러 창을 한 번에 비교 분석이 가능
실습 단계:
2.
@ 를 눌러 오픈한 창 멘션
3.
다음과 같이 요청 입력.
두 인스타그램의 비교표를 만들어줘.
4.
Comet이 각 브라우저창을 분석하여 비교표.
💬
Comet
5.
추가 비교
각각 상위 5개의 게시글을 비교해
💬
GPT 결과
Contact : azureguy@empal.com / azureguy@cau.ac.kr