테이블 명세
구조 설계를 바탕으로 실제 DBMS에서 구현할 쿼리를 작성한다.
Last updated
구조 설계를 바탕으로 실제 DBMS에서 구현할 쿼리를 작성한다.
Last updated
이를 통해 실제로 DBMS 내에 구현할 해당 테이블에 대하여 설명한다.
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
title
글 제목
200자 제한
string
title_token
제목 토큰
(공백으로 스플릿시킨 리스트)
<list:string>
author
작성자
string
0
post
글 내용
200자 제한
string
tag
관여 태그
<list:string>
O
[ ]
img
게시물의 첫 이미지
string
0
url
게시물 URL
string
hashed
게시물 해쉬
(제목 + 내용 + 작성자)
md5 hash (약 32자)
string
info
게시물 출처 식별명
string
O
view
조회수
int
0
fav_cnt
좋아요 수
int
0
token
형태소 분석한 토큰 리스트
<list:string>
O
[ ]
date
작성/수집 날짜
date
now()
end_date
만료 날짜(공모전 등 한정)
date
O
login
로그인 유무
로그인을 해야함: 1
로그인을 안해도 됨: 0
int
topic
게시물의 LDA 토픽
[0.X, 0.X, ...]
<list:float>
인덱스 적용 칼럼
용도
hashed
게시물 중복 검사
date
게시물 시간순 정렬
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
user_id
사용자 학번/아이디
string
user_pw
사용자 비밀번호 해쉬
string
user_name
사용자 이름
string
user_major
사용자 직책/학과
string
O
topic
사용자의 LDA 토픽
[0.X, 0.X, ...]
<list:float>
tag
사용자 관심도 태그
사용자가 가장관심을 준 TOP X개 태그 리스트
<list:string>
O
[ ]
fav_list
사용자가 좋아요 누른 게시물
(해당 게시물의 토픽, 태그를 그대로 가져옴)
최대 X개
<list>{
_id:<oid>, topic:<list>,
tag:<list>,
}
O
[ ]
view_list
사용자가 접근한 게시물
최대 X개
<list>{
_id:<oid>, topic:<list>, tag:<list>
}
O
[ ]
search_list
사용자가 검색한 키워드
최대 X개
<list:string>
O
[ ]
newsfeed_list
사용자가 접근한 뉴스피드 리스트 및 빈도수
<list>{
newsfeed_id: <oid>, topic:<list>, tag:<list>, count:<int>,
}
O
[ ]
인덱스 적용 칼럼
용도
user_id
로그인 성능 향상
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
url
수집 대상 url
string
info
수집 대상 식별 정보
string
title_tag
수집 대상 정적 태그 리스트
<list:string>
login
로그인 필요 여부
필요: 1
필요X: 0
int
crawling
수집 여부
True: 수집 가능
False: 수집 불가
boolean
O
stay_cnt
몇 사이클동안 쉴지 결정하는 횟수
int
O
10
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
title
도메인 제목
string
title_token
제목 토큰
(띄어쓰기로 스플릿)
<list:string>
date
수집 날짜
date
post
도메인 설명
string
img
도메인 첫 이미지
string
url
도메인 URL
string
tag
관여 태그 리스트
<list:string>
[ "사이트", ]
login
로그인 여부
1: 로그인 필수
0: 로그인 불필요
int
0
view
조회
int
fav_cnt
좋아요 수
int
0
token
형태소 분석 태그
<list:string>
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
info_id
타겟 사이트 식별 값
string
title
가장 최근 게시물 제목
string
인덱스 적용 칼럼
용도
title
갱신 검사 성능 향상
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
tag_id
태그 명칭
string
tag_string
해당 태그를 갖는 조건별 단어
<list:string>
인덱스 적용 칼럼
용도
tag_id
검사 성능
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
domain
수집된 외부 도메인
(해당 도메인은 타 테이블에 등록된 URL이 아니여야 함)
string
inter_url
해당 도메인 내부의 URL
<list:string>
칼럼명
칼럼 설명
Type
Null
Default
_id
PK
oid
key
식별
string
value
데이터
<object>