Notice
Recent Posts
Recent Comments
Link
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- pytorch
- pytorch forward 디버깅
- 순열
- Python
- Monte Carlo
- 티스토리챌린지
- TensorFlow
- pytorch hook
- pytorch forward
- 환급기원
- OCR
- 대조학습
- 스페인어학습지
- MCTS
- metric learning
- feature vector
- AlphaGo
- 강화학습
- 알파고
- text embedding
- 문서 파싱
- document parsing
- 스터디미니
- 딥러닝
- permutations
- MTBE
- pytorch forward 연산
- 파이썬
- document layout analysis
- 오블완
Archives
- Today
- Total
목록document layout analysis (1)
Learn And Earn

TL;DR체계적인 레이아웃 데이터 증강 전략을 기반으로 요소 및 레이아웃 다양성 담보한 고품질의 합성 데이터셋 확보. (DocSynth-400K)추가적으로 문서 내 다양한 크기의 객체들 (한 줄 짜리 제목부터 한 페이지 다 차지하는 테이블까지)이 존재함을 고려한 모델 아키텍쳐를 도입했다고 함.DocLayout-YOLO는 YOLO-v10m 을 DocSynth-400K에 사전훈련 후 DocLayNet에 추가적으로 훈련하여 실증화한 모델그림1에서 확인 가능하듯, 속도, 정확도 측면에서 우수한 모델 훈련에 성공하여 실증화 측면에서도 임팩트 있는 연구.Problem and SolutionProblem ❌: unimodal(이미지만 입력)은 빠르지만 부정확한 반면, multimodal(이미지와 텍스트를 입력)은 ..
딥러닝/Document Layout Analysis
2024. 11. 24. 22:36