Notice
Recent Posts
Recent Comments
Link
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- text embedding
- pytorch
- pytorch hook
- pytorch forward
- OCR
- MTBE
- 환급기원
- TensorFlow
- 알파고
- 강화학습
- 딥러닝
- document parsing
- Python
- 파이썬
- permutations
- feature vector
- document layout analysis
- Monte Carlo
- 오블완
- 순열
- metric learning
- 스페인어학습지
- 대조학습
- pytorch forward 연산
- pytorch forward 디버깅
- 티스토리챌린지
- MCTS
- AlphaGo
- 문서 파싱
- 스터디미니
Archives
- Today
- Total
목록document layout analysis (1)
Learn And Earn

TL;DR체계적인 레이아웃 데이터 증강 전략을 기반으로 요소 및 레이아웃 다양성 담보한 고품질의 합성 데이터셋 확보. (DocSynth-400K)추가적으로 문서 내 다양한 크기의 객체들 (한 줄 짜리 제목부터 한 페이지 다 차지하는 테이블까지)이 존재함을 고려한 모델 아키텍쳐를 도입했다고 함.DocLayout-YOLO는 YOLO-v10m 을 DocSynth-400K에 사전훈련 후 DocLayNet에 추가적으로 훈련하여 실증화한 모델그림1에서 확인 가능하듯, 속도, 정확도 측면에서 우수한 모델 훈련에 성공하여 실증화 측면에서도 임팩트 있는 연구.Problem and SolutionProblem ❌: unimodal(이미지만 입력)은 빠르지만 부정확한 반면, multimodal(이미지와 텍스트를 입력)은 ..
딥러닝/Document Layout Analysis
2024. 11. 24. 22:36