테이블 명세
구조 설계를 바탕으로 실제 DBMS에서 구현할 쿼리를 작성한다.
Last updated
구조 설계를 바탕으로 실제 DBMS에서 구현할 쿼리를 작성한다.
Last updated
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
title
글 제목
200자 제한
string
title_token
제목 토큰
(공백으로 스플릿시킨 리스트)
<list:string>
author
작성자
string
0
post
글 내용
200자 제한
string
tag
관여 태그
<list:string>
O
[ ]
img
게시물의 첫 이미지
string
0
url
게시물 URL
string
hashed
게시물 해쉬
(제목 + 내용 + 작성자)
md5 hash (약 32자)
string
info
게시물 출처 식별명
string
O
view
조회수
int
0
fav_cnt
좋아요 수
int
0
token
형태소 분석한 토큰 리스트
<list:string>
O
[ ]
date
작성/수집 날짜
date
now()
end_date
만료 날짜(공모전 등 한정)
date
O
login
로그인 유무
로그인을 해야함: 1
로그인을 안해도 됨: 0
int
topic
게시물의 LDA 토픽
[0.X, 0.X, ...]
<list:float>
인덱스 적용 칼럼
용도
hashed
게시물 중복 검사
date
게시물 시간순 정렬
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
user_id
사용자 학번/아이디
string
user_pw
사용자 비밀번호 해쉬
string
user_name
사용자 이름
string
user_major
사용자 직책/학과
string
O
topic
사용자의 LDA 토픽
[0.X, 0.X, ...]
<list:float>
tag
사용자 관심도 태그
사용자가 가장관심을 준 TOP X개 태그 리스트
<list:string>
O
[ ]
fav_list
사용자가 좋아요 누른 게시물
(해당 게시물의 토픽, 태그를 그대로 가져옴)
최대 X개
<list>{
_id:<oid>, topic:<list>,
tag:<list>,
}
O
[ ]
view_list
사용자가 접근한 게시물
최대 X개
<list>{
_id:<oid>, topic:<list>, tag:<list>
}
O
[ ]
search_list
사용자가 검색한 키워드
최대 X개
<list:string>
O
[ ]
newsfeed_list
사용자가 접근한 뉴스피드 리스트 및 빈도수
<list>{
newsfeed_id: <oid>, topic:<list>, tag:<list>, count:<int>,
}
O
[ ]
인덱스 적용 칼럼
용도
user_id
로그인 성능 향상
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
url
수집 대상 url
string
info
수집 대상 식별 정보
string
title_tag
수집 대상 정적 태그 리스트
<list:string>
login
로그인 필요 여부
필요: 1
필요X: 0
int
crawling
수집 여부
True: 수집 가능
False: 수집 불가
boolean
O
stay_cnt
몇 사이클동안 쉴지 결정하는 횟수
int
O
10
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
title
도메인 제목
string
title_token
제목 토큰
(띄어쓰기로 스플릿)
<list:string>
date
수집 날짜
date
post
도메인 설명
string
img
도메인 첫 이미지
string
url
도메인 URL
string
tag
관여 태그 리스트
<list:string>
[ "사이트", ]
login
로그인 여부
1: 로그인 필수
0: 로그인 불필요
int
0
view
조회
int
fav_cnt
좋아요 수
int
0
token
형태소 분석 태그
<list:string>
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
info_id
타겟 사이트 식별 값
string
title
가장 최근 게시물 제목
string
인덱스 적용 칼럼
용도
title
갱신 검사 성능 향상
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
tag_id
태그 명칭
string
tag_string
해당 태그를 갖는 조건별 단어
<list:string>
인덱스 적용 칼럼
용도
tag_id
검사 성능
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
domain
수집된 외부 도메인
(해당 도메인은 타 테이블에 등록된 URL이 아니여야 함)
string
inter_url
해당 도메인 내부의 URL
<list:string>
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
key
식별
string
value
데이터
<object>