ಸಿಐಐಎಲ್‌ನಿಂದ ಭಾರತೀಯ ಭಾಷೆಗಳ 16 ಹೊಸ ದತ್ತಾಂಶ ಸಂಗ್ರಹಗಳ ಬಿಡುಗಡೆ

| Published : Jan 12 2024, 01:45 AM IST

ಸಿಐಐಎಲ್‌ನಿಂದ ಭಾರತೀಯ ಭಾಷೆಗಳ 16 ಹೊಸ ದತ್ತಾಂಶ ಸಂಗ್ರಹಗಳ ಬಿಡುಗಡೆ
Share this Article
  • FB
  • TW
  • Linkdin
  • Email

ಸಾರಾಂಶ

ಈ ದತ್ತಾಂಶ ಸಂಗ್ರಹಗಳು ಹಿಂದಿ, ಬಂಗಾಳಿ, ತಮಿಳು, ಮರಾಠಿ, ಕನ್ನಡ, ಮಲಯಾಳಂ, ಒಡಿಯಾ, ಅಸ್ಸಾಮಿ, ಕೊಂಕಣಿ, ಮೈಥಿಲಿ, ಉರ್ದು ಮತ್ತು ನೇಪಾಳಿ- 12 ಅನುಸೂಚಿತ ಭಾರತೀಯ ಭಾಷೆಗಳನ್ನು ಒಳಗೊಂಡಿವೆ. ಇದು ಭಾರತೀಯ ಇಂಗ್ಲಿಷಿನ ಎರಡು ರೂಪಾಂತರ ಹೊಂದಿದ್ದು, ಭಾರತೀಯ ಇಂಗ್ಲಿಷಿನ ಬಂಗಾಳಿ ರೂಪಾಂತರ ಮತ್ತು ಕನ್ನಡ ರೂಪಾಂತರಗಳನ್ನು ಹೊಂದಿದೆ.

ಕನ್ನಡಪ್ರಭ ವಾರ್ತೆ ಮೈಸೂರು

ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಮತ್ತು ಯಂತ್ರಕಲಿಕೆಯ ಸಂಶೋಧನೆಗಾಗಿ ಭಾರತೀಯ ಭಾಷಾ ಸಂಸ್ಥೆಯು (ಸಿಐಐಎಲ್) ಭಾರತೀಯ ಭಾಷೆಗಳ 16 ಹೊಸ ದತ್ತಾಂಶ ಸಂಗ್ರಹಗಳ (ಡೇಟಾಸೆಟ್) ಬಿಡುಗಡೆಗೊಳಿಸಿದೆ.

ಭಾರತೀಯ ಭಾಷಿಕ ದತ್ತಾಂಶ ಒಕ್ಕೂಟವು ಭಾರತ ಸರ್ಕಾರದ ಶಿಕ್ಷಣ ಸಚಿವಾಲಯದ ಅಧೀನ ಸಂಸ್ಥೆಯಾದ ಭಾರತೀಯ ಭಾಷಾ ಸಂಸ್ಥಾನದ ಒಂದು ಯೋಜನೆಯಾಗಿದ್ದು, ಇದು ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ಡಿಜಿಟಲ್ ಕಾರ್ಪೊರಾವನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವಲ್ಲಿ ಕಾರ್ಯ ನಿರ್ವಹಿಸುತ್ತಿದೆ.

ಭಾರತೀಯ ಭಾಷಾ ಸಂಸ್ಥಾನದ ನಿರ್ದೇಶಕ ಪ್ರೊ.ಶೈಲೇಂದ್ರ ಮೋಹನ್ ಅಧ್ಯಕ್ಷತೆಯಲ್ಲಿ ಆಯೋಜಿಸಲಾಗಿದ್ದ ಭಾರತೀಯ ಭಾಷಿಕ ದತ್ತಾಂಶ ಒಕ್ಕೂಟದ (ಎಲ್.ಡಿ.ಸಿ- ಐಎಲ್) 8ನೇ ಯೋಜನಾ ಸಲಹಾ ಸಮಿತಿ ಸಭೆಯಲ್ಲಿ ವಿವಿಧ ಕ್ಷೇತ್ರ ತಜ್ಞರು ಮತ್ತು ಉದ್ಯಮ ತಜ್ಞರು ಭಾಗವಹಿಸಿದ್ದರು.

ಈ ಆನ್ ಲೈನ್ ಸಭೆಯಲ್ಲಿ ಪ್ರಮುಖವಾಗಿ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಮತ್ತು ಯಂತ್ರ ಕಲಿಕೆಯಲ್ಲಿ ಗುಣಮಟ್ಟದ ಸಂಶೋಧನೆಯನ್ನು ಹೆಚ್ಚಿಸಲು ಸಹಕಾರಿಯಾಗುವಂತೆ ಭಾರತೀಯ ಭಾಷಿಕ ದತ್ತಾಂಶ ಒಕ್ಕೂಟದ ವತಿಯಿಂದ ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ 16 ಹೊಸ ದತ್ತಾಂಶ ಸಂಗ್ರಹಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಲಾಯಿತು.

ಈ ದತ್ತಾಂಶ ಸಂಗ್ರಹಗಳು ಸ್ವಯಂಚಾಲಿತ ಮಾತಿನ/ ಧ್ವನಿಯ ಗ್ರಹಿಕೆ, ಧ್ವನಿಯ ನೇರ ಅನುವಾದ ಸೇರಿದಂತೆ ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ಹೊಸ ತಂತ್ರಜ್ಞಾನಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ ಮತ್ತು ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ತಂತ್ರಾಂಶ ಉಪಕರಣಗಳಿಂದ ಫಲಿತಾಂಶಗಳ ಗುಣಮಟ್ಟವನ್ನು ಸುಧಾರಿಸಲು ಸಹಕಾರಿಯಾಗಲಿದೆ.

ಈ ದತ್ತಾಂಶ ಸಂಗ್ರಹಗಳು ಹಿಂದಿ, ಬಂಗಾಳಿ, ತಮಿಳು, ಮರಾಠಿ, ಕನ್ನಡ, ಮಲಯಾಳಂ, ಒಡಿಯಾ, ಅಸ್ಸಾಮಿ, ಕೊಂಕಣಿ, ಮೈಥಿಲಿ, ಉರ್ದು ಮತ್ತು ನೇಪಾಳಿ- 12 ಅನುಸೂಚಿತ ಭಾರತೀಯ ಭಾಷೆಗಳನ್ನು ಒಳಗೊಂಡಿವೆ. ಇದು ಭಾರತೀಯ ಇಂಗ್ಲಿಷಿನ ಎರಡು ರೂಪಾಂತರಗಳನ್ನು ಹೊಂದಿದ್ದು, ಭಾರತೀಯ ಇಂಗ್ಲಿಷಿನ ಬಂಗಾಳಿ ರೂಪಾಂತರ ಮತ್ತು ಕನ್ನಡ ರೂಪಾಂತರಗಳನ್ನು ಹೊಂದಿದೆ.

ಭಾರತೀಯ ಇಂಗ್ಲಿಷ್ ಸಹ ಒಂದು ಭಾಷೆಯಾಗಿ ಅಂತಾರಾಷ್ಟ್ರೀಯ ಮಟ್ಟದಲ್ಲಿ ಗುರುತಿಸಿಕೊಂಡಿದೆ ಮತ್ತು ಭಾರತದಲ್ಲಿ ತನ್ನದೇ ಆದ ರೂಪಾಂತರಗಳನ್ನು ಹೊಂದುತ್ತಾ, ಇಲ್ಲಿನ ವಿವಿಧ ಮಾತೃಭಾಷೆಗಳೊಂದಿಗೆ ಸಮ್ಮಿಳಿತವಾಗಿ ಇಂಗ್ಲಿಷ್ ತನ್ನದೇ ಆದ ವಿಭಿನ್ನ ಭಾಷಾ ಶೈಲಿಗಳೊಂದಿಗೆ, ಕೆಲವು ಭಾಷಾವಿಜ್ಞಾನ ಹಾಗೂ ಧ್ವನಿಮಾ ವಿಜ್ಞಾನ ವೈಶಿಷ್ಟ್ಯಗಳೊಂದಿಗೆ ಪ್ರಭಾವಿತವಾಗಿವೆ.

ಮೊದಲ ಬಾರಿಗೆ ಸಂಸ್ಥೆಯು ಛತ್ತೀಸ್ ಗಡಿ ಭಾಷೆಯ ಎರಡು ದತ್ತಾಂಶ ಸಂಗ್ರಹಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದ್ದು, ಇದು ಹಿಂದಿ ಭಾಷೆಯೊಂದಿಗೆ ಸಂಯೋಜಿತ ಮಾತೃಭಾಷೆಯಾಗಿದೆ. ರಾಷ್ಟ್ರೀಯ ಶಿಕ್ಷಣ ನೀತಿ- 2020 ರಲ್ಲಿ ಶಿಫಾರಸು ಮಾಡಿರುವಂತೆ ಶಿಕ್ಷಣ ಮತ್ತು ತಂತ್ರಜ್ಞಾನವನ್ನು ಭಾರತದ ಎಲ್ಲ ಮಾತೃಭಾಷೆಗಳ ಮೂಲಕ ಉತ್ತೇಜಿಸುವ ಸರ್ಕಾರದ ಗಂಭೀರ ನಿಲುವನ್ನು ಇದು ಪ್ರತಿಪಾದಿಸುತ್ತದೆ.

ಈ ದತ್ತಾಂಶ ಸಂಗ್ರಹಗಳು ಎಲ್ಲಾ ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ಸಂಶೋಧನೆ ಮತ್ತು ಅಭಿವೃದ್ಧಿಯನ್ನು ಪ್ರೋತ್ಸಾಹಿಸುತ್ತವೆ ಮತ್ತು ಇವುಗಳಿಂದ ಶೈಕ್ಷಣಿಕ ವಲಯ ಹಾಗೂ ಸಂಬಂಧಿತ ಉದ್ಯಮಗಳು ಪ್ರಯೋಜನವನ್ನು ಪಡೆಯುತ್ತವೆ. ಈ ದತ್ತಾಂಶ ಸಂಗ್ರಹಗಳನ್ನು ಬಳಸಿ ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾದ ಅಪ್ಲಿಕೇಶನ್ ಗಳು ಅಂತಿಮವಾಗಿ ಈ ಭಾಷೆಗಳ ಉನ್ನತಿಗೆ ಸಹಾಯ ಮಾಡಲಿವೆ. ಈ ಎಲ್ಲಾ ದತ್ತಾಂಶ ಸಂಗ್ರಹಗಳು https://data.ldcil.org ವೆಬ್ ಸೈಟ್ ನಲ್ಲಿ ಲಭ್ಯವಿದೆ.