You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
안녕하세요, sooftware님께서 좋은 자료를 배포해주셨는데 초심자 분들께 조금이나마 도움이 되고자 글을 올립니다.
저도 초심자라 우여곡절을 겪었지만 다행히 DeepSpeech2 모델 훈련에 성공하여 해당 모델을 공유 드리고자 합니다.
저는 이 모델을 이용하여 실시간 음성을 받아들이고 인퍼런스 할 수 있도록 응용해보았습니다.
솔직히 정확도가 아주 좋지는 않지만, 처음이니까 모델을 훈련시키고 인퍼런스 하는 것에 의의를 두었습니다.
초심자분들께서 간단하게 인퍼런스라도 해보실 수 있다면 좋을 것 같습니다 :)
pre-trained model이 약 200메가 정도가 되어서 용량 제한이 걸렸습니다.
git lfs (large file storage)를 이용해서 해결은 해보았으나, 다운을 받을 때도 lfs를 이용해야 제대로 받아지더라구요..ㅠ
그래서 최대한 편하게 사용하실 수 있도록 구글 드라이브로 링크로 대체했습니다.
사용에 관한 방법도 위의 링크에서 확인해보실 수 있습니다!
모델 훈련에 대한 내용은 아래와 같습니다.
Model : DeepSpeech2
Dataset: Ksponspeech
GPU: RTX 3080ti
CPU: intel i9-12900k
소요시간 : Epoch 당 약 6.5시간 (총 13 Epoch)
훈련 성과 : CER 0.2536
@sooftware 바쁘실텐데 댓글 달아주셔서 감사드립니다!!
깃허브 활동이 아직 익숙치 않아 말씀해주신 것에 대해서 한번 더 여쭙고 싶습니다.
Pull Request는 제가 디버깅을 하면서 수정했던 내용을 정리해서 요청 드리는 것으로 알고 있는데, README쪽에 PR을 날린다는 것이 정확히 어떤 의미인가요? 제가 잘 이해를 못했습니다 ㅠㅠ
Pull request의 경우에는 저도 여러 시도를 통해서 성공한 거라 확신이 없어서 요청을 드리기가 굉장히 조심스러운데, 제가 도움이 된다면 말씀해주신 김에 용기를 내어서 전체적인 검토 후에 조금이라도 기여해볼 수 있으면 좋겠습니다 :)
안녕하세요, sooftware님께서 좋은 자료를 배포해주셨는데 초심자 분들께 조금이나마 도움이 되고자 글을 올립니다.
저도 초심자라 우여곡절을 겪었지만 다행히 DeepSpeech2 모델 훈련에 성공하여 해당 모델을 공유 드리고자 합니다.
저는 이 모델을 이용하여 실시간 음성을 받아들이고 인퍼런스 할 수 있도록 응용해보았습니다.
솔직히 정확도가 아주 좋지는 않지만, 처음이니까 모델을 훈련시키고 인퍼런스 하는 것에 의의를 두었습니다.
초심자분들께서 간단하게 인퍼런스라도 해보실 수 있다면 좋을 것 같습니다 :)
pre-trained model은 아래 링크로 와주시면 3. How to use에서 구글 드라이브로 연동된 링크를 통해 다운로드하실 수 있습니다.
https://github.com/kthworks/KoreanSTT-DeepSpeech2
pre-trained model이 약 200메가 정도가 되어서 용량 제한이 걸렸습니다.
git lfs (large file storage)를 이용해서 해결은 해보았으나, 다운을 받을 때도 lfs를 이용해야 제대로 받아지더라구요..ㅠ
그래서 최대한 편하게 사용하실 수 있도록 구글 드라이브로 링크로 대체했습니다.
사용에 관한 방법도 위의 링크에서 확인해보실 수 있습니다!
모델 훈련에 대한 내용은 아래와 같습니다.
Model : DeepSpeech2
Dataset: Ksponspeech
GPU: RTX 3080ti
CPU: intel i9-12900k
소요시간 : Epoch 당 약 6.5시간 (총 13 Epoch)
훈련 성과 : CER 0.2536
혹시 pre-trained 모델 말고, 직접 학습을 도전하시다가 막히신 분들을 위해서 제가 도움을 많이 받은 mingchin님의 블로그 링크도 아래 달아 두겠습니다.
https://mingchin.tistory.com/152
좋은 오픈소스 제공해주신 sooftware님께 다시 한번 감사드리며, kospeech에 도전 중이신 여러분들도 모두 각자의 목표를 달성하시길 응원합니다 !
The text was updated successfully, but these errors were encountered: