Face Recognition

Tổng hợp datasets

Gần đây gặp nhiều project làm về phát hiện và nhận diện khuôn mặt (face recognition). Về tác vụ này thì người ta đã nghiên cứu và thực hiện từ khá lâu rồi. Như ở Nhật thì có một số công ty như Panasonic hay NEC đều có những solution đứng top thế giới về độ chính xác và tốc độ (Có thể tham khảo tại đây).

Ở phần 1 này mình thống kê một số datasets được public
Dataset cho training:
1. CelebA
Dành cho mục đích phi thương mại, nghiên cứu. Data này gồm 200k ảnh những người nổi tiếng(10k ids), được thu thập và cung cấp từ MMLAB, một lab nghiên cứu của một trường đại học ở HongKong.
2. Face Image with Marked Landmark Point
Data này gồm 7k ảnh với mỗi ảnh đã được đánh nhãn cho keypoints (các điểm đặc trưng trên khuôn mặt). Trên mỗi ảnh tối đa có 15 keypoints, và thông tin này được lưu riêng trong file CSV.
3. Casia WebFace
Gồm 453453 ảnh cho 10575 ids (Các bạn Tàu cung cấp).
4. UMDFaces
Dataset gồm 367888 ảnh cho 8277 ids.
5. VGGFace2
Link tải từ dropbox.
Dataset gồm 3.31M ảnh cho 9131 ids.
6. MS1M-IBUG
Link download tại đây. Dataset gồm 3.8M ảnh cho 85k ids.
7. MS1M-ArcFace
Dataset gồm 5.8M ảnh cho 85k ids. Dataset này là một version mở rộng của tập MS1M-IBUG trên.
8. Asian-Celeb
Dataset gồm 2.8M ảnh cho 94k ids.
9. DeepGlint
Dataset gồm 6.75M ảnh cho 181k ids.
10. IMDB-Face
Dataset gồm 1.7M ảnh cho 59k ids.
11. Celeb500k
Hiện tại chưa tìm thấy link download. Data này rất lớn, gồm 50M ảnh cho 500k ids.
12. MegaFace
Download tại đây. Dataset gồm 4.7M ảnh cho 672k ids.

Dataset cho validation:
1. CFP-FP
Dataset gồm 7k ảnh với 500 ids.
2. AgeDB
Dataset gồm 12240 ảnh cho 570 ids.
3. LFW
Dataset gồm 13233 ảnh cho 5749 ids.
4. CALFW
Một phiên bản nâng cấp của tập LFW. Cũng bao gồm 13233 ảnh cho 5749 ids.

Share

Leave a Reply

Your email address will not be published. Required fields are marked *