
Tamil: 
வணக்கம்.
ஆராய்ச்சி அறிமுகம்
நிச்சயமாக வரவேற்கிறது;
குறிப்பாக, பகுப்பாய்வு
பற்றிய விரிவுரை.
முந்தைய விரிவுரைகளில்,
ஆராய்ச்சியின் பொருள்
என்ன என்பதை நீங்கள்
அறிந்து கொண்டீர்கள்.
ஆராய்ச்சி பற்றிய
ஒரு கண்ணோட்டத்தை
நாங்கள் வழங்க முயற்சித்தோம்,
நிச்சயமாக, இலக்கிய
ஆய்வுகளில் ஒரு விரிவுரையை
நாங்கள் கடந்து விட்டோம்.
இந்த விரிவுரையில்,
குறிப்பாக டேட்டா
அனாலிசிஸ் (Data Analysis),
டேட்டா (Data) வகைகள்

Marathi: 
हॅलो संशोधन प्रस्तावनांवरील
अभ्यासक्रमांमध्ये
आपले स्वागत आहे;
विशेषतः, डेटा विश्लेषण
वरील व्याख्यान.
मागील व्याख्याने
मध्ये, आपण शिकलो
आहे याचा अर्थ काय
आहे. आम्ही आपल्याला
संशोधनाचा आढावा
देण्याचा प्रयत्न
केला आहे, आणि नक्कीच,
आम्ही साहित्य संशोधनावर
एक व्याख्यानही घेतला
आहे. या व्याख्यानात,
आम्ही विशेषत: डेटा
विश्लेषण काय आहे,
विश्लेषण प्रकार
आणि डेटा विश्लेषण
मध्ये एक आढळतात
की विविध प्रकारचे
डेटा, आणि अर्थातच,
एक पद्धतशीर पद्धत
काय आहे ते पाहू.
आम्ही व्याख्यानाच्या
शेवटी R सॉफ्टवेअर
लॅंगवेज मध्ये 2 उदाहरणे
देणार आहोत, R हे डाटा
विश्लेषण साठि वापरत
येणारे टूल आहे. डेटा
विश्लेषण कोणत्याही
संशोधनाच्या कार्याचा
एक अविभाज्य भाग
आहे. प्रत्येक प्रकारचे
संशोधन केले जाते
त्यानुसार, एक किंवा

Kannada: 
ಸಂಶೋಧನೆಗೆ ಪೀಠಿಕೆ
ಕೋರ್ಸ್ಗೆ ಸ್ವಾಗತ;
ನಿರ್ದಿಷ್ಟವಾಗಿ ಡೇಟಾ
ಅನಾಲಿಸಿಸ್.
ಹಿಂದಿನ ಉಪನ್ಯಾಸಗಳಲ್ಲಿ,
ಸಂಶೋಧನೆಯ ಅರ್ಥವೇನೆಂದು
ನೀವು ಕಲಿತಿದ್ದೀರಿ.
ನಾವು ಸಂಶೋಧನೆಯ ಒಂದು
ಅವಲೋಕನವನ್ನು ನೀಡಲು
ಪ್ರಯತ್ನಿಸಿದ್ದೇವೆ
ಮತ್ತು ಸಹಜವಾಗಿ, ನಾವು
ಸಾಹಿತ್ಯ ವಿಮರ್ಶೆಯ
ಬಗ್ಗೆ ಉಪನ್ಯಾಸ ನೀಡಿದ್ದೇವೆ.
ಈ ಉಪನ್ಯಾಸದಲ್ಲಿ,
ನಾವು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ,
ವಿಶ್ಲೇಷಣೆಯ ಪ್ರಕಾರಗಳು
ಮತ್ತು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಎನ್ಕೌಂಟರ್ ಮಾಡಬಹುದಾದ
ವಿಭಿನ್ನ ರೀತಿಯ ಡೇಟಾ,
ಮತ್ತು ಸಹಜವಾಗಿ, ವ್ಯವಸ್ಥಿತ
ಕಾರ್ಯವಿಧಾನವನ್ನು
ನಿರ್ದಿಷ್ಟವಾಗಿ ನೋಡೋಣ.

Malayalam: 
ഹലോ, ഗവേഷണത്തിന്‍റെ
ആമുഖത്തെക്കുറിച്ചുള്ള
കോഴ്സിലേക്ക് സ്വാഗതം.
പ്രത്യേകിച്ച, ഡാറ്റാ
അനാലിസിസ് എന്ന വിഷയത്തിലേക്കും,
മുമ്പത്തെ ലെക്ചറുകളില്‍
നിങ്ങള്‍ ഗവേഷണം
എന്താണ് അര്‍ത്ഥമാക്കുന്നതെന്ന്
പഠിച്ചു.
ഗവേഷണത്തിന്‍റെ
അവലോകനം നിങ്ങള്‍ക്ക്
നല്‍കാന്‍ ഞങ്ങള്‍
ശ്രമിച്ചിട്ടുണ്ട്.
തീര്‍ച്ചയായും, സാഹിത്യ
അവലോകനത്തിന്‍റെ
ഒരു ലെക്ചറിലൂടെ
ഞങ്ങള്‍ കടന്നുപോയിട്ടുണ്ട്.
അതില്‍ ഡാറ്റ വിശകലനം,
വിശകലനതരം, ഡാറ്റ
വിശകലനത്തില്‍ നേരിടുന്ന
വ്യത്യസ്ത തരത്തിലുള്ള
ഡാറ്റ, തീര്‍ച്ചയായും,
ഒരു വ്യവസ്ഥാപിതമായ
രീതി എന്നിവ ഞങ്ങള്‍
പ്രത്യേകം നോക്കിയിട്ടുണ്ട്.
ഒരു ഭാഷയില്‍ അല്ലെങ്കില്‍
R എന്ന സോഫ്റ്റ് വെയര്‍
പ്ലാറ്റ്ഫോമില്‍
നമുക്കൊരു ലെക്ചര്‍
അവസാനിപ്പിക്കാം.

Gujarati: 
હેલો. રિસર્ચના પરિચય
પર અભ્યાસક્રમ પર
આપનું સ્વાગત છે;
ખાસ કરીને, ડેટા એનાલિસિસ(data
analysis) પરનો પ્રવચન.

English: 
Hello. Welcome to the course on Introduction
to Research; in particular, the lecture on
Data Analysis. In the previous lectures, you
have learnt what is meant by research. We
have tried to give you an overview of research,
and of course, we have also gone through a
lecture on literature review. In this lecture,
we will specifically look at what is data
analysis, the types of analysis, and the different
types of data that one encounters in data
analysis, and of course, a systematic procedure.
We will end the lecture with two hands-on
examples in a language or in a software platform

Bengali: 
হ্যালো।
গবেষণা ভূমিকা স্বাগতম;
বিশেষ করে, ডেটা বিশ্লেষণের
বক্তৃতা।
পূর্ববর্তী বক্তৃতাগুলিতে,
আপনি শিখেছেন যে
গবেষণাটি কী বোঝায়।
আমরা আপনাকে একটি
গবেষণা সংক্ষিপ্ত
বিবরণ দিতে চেষ্টা
করেছি, এবং অবশ্যই,
আমরা সাহিত্য পর্যালোচনা
একটি বক্তৃতা মাধ্যমে
চলে গেছে।

Hindi: 
नमस्ते।
अनुसंधान के लिए
परिचय पर पाठ्यक्रम
में आपका स्वागत
है; विशेष रूप से,
डेटा विश्लेषण (DATA
ANALYSIS)पर व्याख्यान।
पिछले व्याख्यानों
में, आपने सीखा है
कि शोध से क्या अभिप्राय
है।
हमने आपको शोध का
अवलोकन करने की कोशिश
की है, और निश्चित
रूप से, हम साहित्य
समीक्षा पर एक व्याख्यान
के माध्यम से भी गए
हैं।
इस व्याख्यान में,
हम विशेष रूप से देखेंगे
कि डेटा विश्लेषण,
विश्लेषण के प्रकार,
और विभिन्न प्रकार
के डेटा जो डेटा विश्लेषण
(DATA ANALYSIS)में सामना करते
हैं, और निश्चित रूप
से, एक व्यवस्थित
प्रक्रिया है।
हम भाषा में या सॉफ़्टवेयर
प्लेटफ़ॉर्म (software
platform) में दो हाथों
के उदाहरणों के साथ
व्याख्यान समाप्त
करेंगे जो सांख्यिकीय
(statistical) डेटा विश्लेषण
(DATA ANALYSIS) के लिए एक ओपन
सोर्स फ्री सॉफ्टवेयर
है।
अब, आगे बढ़ने से पहले,
मैं आपको बताता हूं
कि डेटा विश्लेषण
(DATA ANALYSIS) किसी भी शोध

Tamil: 
மற்றும் ஒரு திட்டமிட்ட
செயல்முறையை எதிர்கொள்கின்ற
பல்வேறு வகையான தரவு
ஆகியவற்றை நாம் குறிப்பாக
பார்ப்போம்.
நாம் இரண்டு பேச்சைப்
பயன்படுத்தி விரிவுரைகளை
முடிவு செய்வோம்.
ஒரு மொழியில் அல்லது
ஆர் (R) என்றழைக்கப்படும்
ஒரு மென்பொருள் மேடையில்,
புள்ளிவிவர தரவு
பகுப்பாய்வுக்கான
திறந்த மூல மென்பொருள்.
இப்போது, ​​மேலும்
முன்னேறுவதற்கு
முன், டேட்டா (Data) ஆய்வு
என்பது எந்த ஆராய்ச்சி
வேலைகளின் ஒரு பகுதி
என்று நான் உங்களுக்கு
கூற விரும்புகிறேன்.
ஒவ்வொரு வகையிலும்
ஆராய்ச்சியை மேற்கொள்ளும்

Kannada: 
ಭಾಷೆಯಲ್ಲಿರುವ ಉದಾಹರಣೆಗಳಲ್ಲಿ
ಅಥವಾ ಆರ್ ಎಂಬ ತಂತ್ರಾಂಶ
ವೇದಿಕೆಯಲ್ಲಿ ನಾವು
ಉಪನ್ಯಾಸವನ್ನು ಮುಕ್ತಾಯಗೊಳಿಸುತ್ತೇವೆ.
ಇದು ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ
ಮಾಹಿತಿ ವಿಶ್ಲೇಷಣೆಗಾಗಿ
ಮುಕ್ತ ಮೂಲದ ಉಚಿತ
ಸಾಫ್ಟ್ವೇರ್ ಆಗಿದೆ.
ಈಗ, ನಾವು ಮುಂದುವರಿಯುವ
ಮೊದಲು, ಯಾವುದೇ ವಿಶ್ಲೇಷಣಾತ್ಮಕ
ಮಾಹಿತಿಯ ದತ್ತಾಂಶ
ವಿಶ್ಲೇಷಣೆ ಅವಿಭಾಜ್ಯ
ಅಂಗವಾಗಿದೆ ಎಂದು ಹೇಳುತ್ತೇನೆ.
ಪ್ರತಿಯೊಂದೂ ನಡೆಸುವ
ಸಂಶೋಧನೆಯ ಪ್ರಕಾರ,
ಏಕರೂಪವಾಗಿ, ಒಬ್ಬರು
ಕೆಲವು ಡೇಟಾವನ್ನು
ಅಥವಾ ಇನ್ನೊಂದನ್ನು
ಸಂಗ್ರಹಿಸುತ್ತಾನೆ.
ಇದು ಸೈದ್ಧಾಂತಿಕ ಸಂಶೋಧನೆಯಾಗಿದ್ದರೂ
ಸಹ, ಸಮಯದ ಒಂದು ಹಂತದಲ್ಲಿ,
ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾದ
ಸಿದ್ಧಾಂತವನ್ನು ದೃಢೀಕರಿಸುವಲ್ಲಿ
ಪ್ರಾಯೋಗಿಕ ಕೆಲಸದ
ಸ್ವಲ್ಪ ಭಾಗವಿದೆ.
ಮತ್ತು ನೀವು ಇಂದು
ನೋಡಿದರೆ, ಡೇಟಾ ಅನಾಲಿಟಿಕ್ಸ್

Gujarati: 
પાછલા પ્રવચનોમાં,
તમે શીખ્યા છો કે
સંશોધન દ્વારા શું
કહેવામાં આવ્યું
છે. અમે તમને સંશોધનની
ઝાંખી આપવાનો પ્રયાસ

English: 
called R which is an open source free software
for statistical data analysis. Now, before
we proceed further, let me tell you that data
analysis is an integral part of any research
work. In every type of research that one carries
out, invariably, one collects some data or
the other. Even if it’s theoretical research,
at some point in time, there is a bit of experimental
work involved to corroborate the theory that
has been developed. By and large, if you look
at today, the scenario is about data analytics.
A lot of data has been generated not just
in engineering arena, but every where, and
therefore, there is a need to understand how
to analyze data in a systematic manner. There
are many, many software packages that can

Hindi: 
कार्य(research work) का एक
अभिन्न हिस्सा है।
प्रत्येक प्रकार
के शोध में जो कोई
होता है, हमेशा, कोई
डेटा या दूसरे को
एकत्र करता है।
भले ही यह सैद्धांतिक
(THEORETICAL) अनुसंधान (theoretical
research) है, कुछ समय पर,
विकसित किए गए सिद्धांत
की पुष्टि करने के
लिए कुछ प्रयोगात्मक
कार्य शामिल है।
बड़े पैमाने पर, यदि
आप आज देखते हैं, तो
परिदृश्य डेटा एनालिटिक्स
के बारे में है।
इंजीनियरिंग क्षेत्र
में न केवल बहुत सारे
डेटा उत्पन्न किए
गए हैं, बल्कि हर जगह,
और इसलिए, व्यवस्थित
ढंग से डेटा का विश्लेषण
करने के तरीके को
समझने की आवश्यकता
है।
कई सारे सॉफ्टवेयर
पैकेज हैं जो विभिन्न
प्रकार के डेटा का
विश्लेषण कर सकते
हैं।
और किसी को यह याद
रखना चाहिए कि डेटा
का विश्लेषण करना
सॉफ्टवेयर पैकेजों
में डेटा फेंकने
के बारे में नहीं
है, और फिर, उत्पन्न
होने वाले कुछ फैंसी
ग्राफ़ की रिपोर्ट
करना और कुछ अच्छे
परिणाम जो आपको आपके
कंप्यूटर स्क्रीन
पर मिलते हैं - वह
डेटा विश्लेषण (DATA
ANALYSIS)नहीं है; यह उस
अभ्यास का बहुत छोटा
हिस्सा है।जितना
हम डेटा का विश्लेषण

Malayalam: 
അതില്‍ R എന്ന സോഫ്റ്റ്
വെയര്‍ സ്റ്റാറ്റിസ്റ്റിക്കല്‍
ഡേറ്റാ അനാലിസിസിന്
ഓപ്പണ്‍ സോഴ്സ് ഫ്രീ
സോഫ്റ്റ് വെയര്‍
ആണ്. ഇപ്പോള്‍ നമ്മള്‍
മുന്നോട്ടുപോകുന്നതിന്
മുമ്പ്, ഡാറ്റ വിശകലനം
ഏതെങ്കിലും ഗവേഷണപ്രവൃത്തിയുടെ
അവിഭാജ്യഘടകമാണെന്ന്
ഞാന്‍ പറയുന്നു.
ഓരോ തരത്തിലുള്ള
ഗവേഷണത്തിലും ഒരാള്‍
സ്ഥിരമായി ചില ഡാറ്റ
അല്ലെങ്കില്‍ മറ്റേതെങ്കിലും
ശേഖരിക്കുന്നു.
അത് സൈദ്ധാന്തികമായ
ഗവേഷണമാണെങ്കിലും
കാലാകാലങ്ങളില്‍
വികസിപ്പിച്ചെടുത്ത
സിദ്ധാന്തത്തെ കൃത്യമായി
വിലയിരുത്തുന്നതിന്
ഒരു പരീക്ഷണപ്രയത്നം
നടക്കുന്നു.
നിങ്ങള്‍ ഇന്ന് നോക്കുന്നത്
ഡാറ്റ അപഗ്രഥനത്തെക്കുറിച്ചാണ്.
എഞ്ചിനീയറിംഗ് രംഗത്തെ
മാത്രമല്ല, എല്ലാ
ഡാറ്റകളും ഒരു ഡാറ്റാരൂപത്തില്‍
വിശകലനം ചെയ്യേണ്ടത്
എങ്ങനെയെന്ന് മനസ്സിലാക്കേണ്ടത്
ആവശ്യമാണ്.
വിവിധതരത്തിലുള്ള
ഡാറ്റ വിശകലനം ചെയ്യാന്‍
കഴിയുന്ന നിരവധി
സോഫ്റ്റ് വെയര്‍
പാക്കേജുകള്‍ ഉണ്ട്.
എന്നാല്‍ ഓര്‍മ്മിക്കേണ്ട
ഒരു കാര്യ ഡാറ്റ
പാക്കേജുകളിലേക്ക്
ഡാറ്റ കൊടുക്കുക
മാത്രമല്ല, വിശകലനം
ചെയ്യുന്ന ഫാന്‍സിഗ്രാഫുകളും
നിങ്ങളുടെ കമ്പ്യൂട്ടര്‍
സ്ക്രീനില്‍ ലഭിച്ചിരിക്കുന്ന

Marathi: 
दुसरा डेटा गोळा
करतो. जरी सैद्धांतिक
संशोधन असले तरी,
एखादेवेळी, सिद्धांताची
पुष्टी करण्यासाठी
काही प्रायोगिक कार्य
करावे लागते.
आपण आज पाहत असलात
तरी, परिस्थिती ही
डेटा विश्लेषणे बद्दल
आहे. फक्त अभियांत्रिकी
क्षेत्रामध्ये बर्याच
प्रमाणात डेटा तयार
केला जात नाही, परंतु
प्रत्येक ठिकाणी,
आणि म्हणून, व्यवस्थित
पद्धतीने डेटाचा
विश्लेषण कसा करावा
हे समजून घेणे आवश्यक
आहे. बर्याच, अनेक
सॉफ्टवेअर पॅकेजेस
आहेत जे वेगवेगळ्या
प्रकारच्या डेटाचे
विश्लेषण करू शकतात.
आणि हे लक्षात ठेवा
की डेटाचे विश्लेषण
करणे फक्त सॉफ्टवेअर
पॅकेजेसमध्ये डेटा
फेकण्याविषयी नाही
आणि नंतर काही फॅन्सी
ग्राफ तयार केले
जातात आणि आपण आपल्या
संगणकाच्या पडद्यावर
काही चांगले परिणाम
मिळवितात - ते डेटा
विश्लेषण नाही; तो
फक्त त्या व्यायामाचा
एक अत्यंत लहान भाग
आहे आम्ही डेटाचे
विश्लेषण करत आहोत
त्याप्रमाणे, त्यात
एक सिद्धांत आहे
आणि अर्थातच, आम्ही
डेटा विश्लेषणाच्या

Bengali: 
এই বক্তৃতাতে, আমরা
বিশেষ করে ডেটা বিশ্লেষণ,
বিশ্লেষণের বিভিন্ন
ধরণের এবং ডেটা বিশ্লেষণের
সাথে মিলিত বিভিন্ন
ধরনের ডেটা, এবং অবশ্যই,
একটি পদ্ধতিগত পদ্ধতির
দিকে দৃষ্টিপাত করবো।
আমরা ল্যাঙ্গুয়েজ
শেষ করে দুই হ্যান্ড-অনের
উদাহরণ দিয়ে একটি
ভাষা বা একটি সফটওয়্যার

Gujarati: 
કર્યો છે, અને અલબત્ત,
અમે સાહિત્ય સમીક્ષા
પરના વ્યાખ્યાન દ્વારા
પણ આ વિષય પર ગયા છીએ.
આ વ્યાખ્યાનમાં,
ખાસ કરીને ડેટા એનાલિસિસ(data

Kannada: 
ಬಗ್ಗೆ ಸನ್ನಿವೇಶವು
ದೊಡ್ಡದಾಗಿದೆ.
ಎಂಜಿನಿಯರಿಂಗ್ ಕ್ಷೇತ್ರದಲ್ಲಿ
ಕೇವಲ ಬಹಳಷ್ಟು ಡೇಟಾವನ್ನು
ಉತ್ಪಾದಿಸಲಾಗಿದೆ,
ಆದರೆ ವ್ಯವಸ್ಥಿತವಾದ
ರೀತಿಯಲ್ಲಿ ಡೇಟಾವನ್ನು
ಹೇಗೆ ವಿಶ್ಲೇಷಿಸುವುದು
ಎಂಬುದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ
ಅವಶ್ಯಕತೆ ಇದೆ. ವಿಭಿನ್ನ
ರೀತಿಯ ಮಾಹಿತಿಯ ವಿಶ್ಲೇಷಣೆಯನ್ನು
ಕೈಗೊಳ್ಳಲು ಅನೇಕ ತಂತ್ರಾಂಶ
ಪ್ಯಾಕೇಜುಗಳಿವೆ.
ವಿಶ್ಲೇಷಣಾತ್ಮಕ ಡೇಟಾವು
ಸಾಫ್ಟ್ವೇರ್ ಪ್ಯಾಕೇಜ್ಗಳಲ್ಲಿ
ಡೇಟಾವನ್ನು ಎಸೆಯುವುದರ
ಬಗ್ಗೆ ಅಲ್ಲ, ತದನಂತರ,
ರಚಿಸಲಾದ ಕೆಲವು ಅಲಂಕಾರಿಕ
ಗ್ರ್ಯಾಫ್ಗಳು ಮತ್ತು
ನಿಮ್ಮ ಕಂಪ್ಯೂಟರ್
ಪರದೆಯಲ್ಲಿ ನೀವು ಪಡೆಯುವ
ಕೆಲವು ಉತ್ತಮ ಫಲಿತಾಂಶಗಳನ್ನು
ವರದಿ ಮಾಡುವ ಬಗ್ಗೆ
ಅಲ್ಲ - ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
ಅಲ್ಲ; ಅದು ಆ ವ್ಯಾಯಾಮದ
ಅತ್ಯಂತ ಚಿಕ್ಕ ಭಾಗವಾಗಿದೆ.

Tamil: 
ஒவ்வொரு முறையும்,
ஒரு சில டேட்டா (Data)
அல்லது பிற தகவல்களை
சேகரிக்கிறது.
இது கோட்பாட்டு ரீதியான
ஆராய்ச்சி ஆயினும்,
சில காலக்கட்டத்தில்,
வளர்ச்சியடைந்த
கோட்பாட்டை உறுதிப்படுத்துவதில்
சோதனையின் ஒரு பிட்
(bit) உள்ளது.
இன்றைய தினம் நீங்கள்
பார்த்தால், டேட்டா
அனாலிசிஸ் (Data Analysis)
பற்றியது.
தரவுத்தளமானது இன்ஜினியரிங்
(engineering) துறையில் மட்டுமல்லாமல்,
ஒவ்வொரு இடத்திலும்,
டேட்டா (Data) முறையை
எவ்வாறு அனாலிசிஸ்
(Analysis) செய்ய வேண்டும்
என்பதை புரிந்து
கொள்ள வேண்டிய அவசியம்
உள்ளது.

English: 
carry out analysis of different types of data.
And one should remember that analyzing data
is not just about throwing data into the software
packages, and then, reporting some of the
fancy graphs that are generated and some nice
results that you get on your computer screen
- that is not data analysis; it’s just a
very tiny part of that exercise.
As much as we are analyzing data, there is
a theory to it, and of course, we are not
going go over the theory of data analysis,
but the procedure that one needs to follow
to get meaningful results. First of all, we
need to ask - what is data analysis?
Analysis of data is about extracting useful,
relevant, and meaningful information from
observations. As I said, we collect data in
different spheres and different forms, whether
it’s econometrics, whether it’s engineering
or medicine or any other field, we have different

Bengali: 
প্ল্যাটফর্ম যা R
কে বলা হয় যা পরিসংখ্যানগত
বিশ্লেষণের জন্য
একটি মুক্ত উৎস ফ্রি
সফটওয়্যার।
এখন, আমরা এগিয়ে
যাওয়ার আগে, আমি
আপনাকে বলি যে তথ্য
বিশ্লেষণ কোন গবেষণা
কাজ একটি অবিচ্ছেদ্য
অংশ।
প্রত্যেকটি গবেষণা
করা হয়, যেটি একটি
বহন করে, অনির্দিষ্টভাবে,
কেউ কিছু তথ্য বা

Hindi: 
कर रहे हैं, उसके लिए
एक सिद्धांत है, और
निश्चित रूप से, हम
डेटा विश्लेषण (DATA
ANALYSIS)के सिद्धांत पर
नहीं जा रहे हैं, लेकिन
एक प्रक्रिया जिसे
सार्थक परिणाम प्राप्त
करने के लिए पालन
करने की आवश्यकता
है।
सबसे पहले, हमें यह
पूछने की ज़रूरत
है - डेटा विश्लेषण
(DATA ANALYSIS)क्या है?
डेटा का विश्लेषण
अवलोकनों से उपयोगी,
प्रासंगिक और सार्थक
जानकारी निकालने
के बारे में है।
जैसा कि मैंने कहा,
हम अलग-अलग क्षेत्रों
और विभिन्न रूपों
में डेटा एकत्र करते
हैं, भले ही यह अर्थशास्त्र
है, चाहे वह इंजीनियरिंग
या दवा हो या कोई अन्य
क्षेत्र हो, हमारे
पास विभिन्न प्रकार
के डेटा एकत्र किए
गए हैं और डेटा एकत्र
करने का उद्देश्य
मूल रूप से प्रक्रिया
के बारे में कुछ जानना
है; लेकिन, ज़ाहिर
है, यह एकमात्र उद्देश्य
नहीं है।
जैसा कि मैंने यहां
सूचीबद्ध किया है,
डेटा विश्लेषण (DATA
ANALYSIS)के कई उद्देश्य
हैं।
यह सामान्य रूप से
हो सकता है .. उदाहरण
के लिए, सामान्य उद्देश्यों,
पैरामीटर अनुमान
जहां हम कुछ अज्ञातों
का उल्लंघन कर रहे

Malayalam: 
ചില നല്ല ഫലങ്ങള്‍
റിപ്പോര്‍ട്ട് ചെയ്യലും
മാത്രമല്ല, ഡാറ്റ
വിശകലനം.
അത് വിശകലനത്തിന്‍റെ
ഒരു ചെറിയ ഭാഗം മാത്രമാണ്.
നമ്മള്‍ ഡാറ്റ വിശകലനം
ചെയ്യുന്നതിന് ഒരു
സിദ്ധാന്തം തന്നെയുണ്ട്.
തീര്‍ച്ചയായും, നമ്മള്‍
ഡാറ്റ വിശകലനസിദ്ധാന്തത്തെ
മറികടക്കുകയല്ല.
പക്ഷേ, അര്‍ത്ഥപൂര്‍ണ്ണഫലങ്ങള്‍
ലഭിക്കാന്‍ പിന്തുടരേണ്ട
നടപടിക്രമങ്ങളുണ്ട്.
ഒന്നാമതായി, നമ്മള്‍
മനസ്സിലാക്കേണ്ടത്
ഡാറ്റ വിശകലനം എന്താണ്?
വിവരങ്ങളുടെ വിശകലനം
നിരീക്ഷണങ്ങളില്‍
നിന്ന് ഉപയോഗപ്രദവും
ഉചിതമായതും അര്‍ത്ഥവത്തായതുമായ
വിവരങ്ങള്‍ ലഭ്യമാക്കുന്നതിനെക്കുറിച്ചാണ്.
ഞാന്‍ പറഞ്ഞതുപോലെ,
വിവിധമേഖലകളിലും
വിവിധരൂപങ്ങളിലും
ഡാറ്റ ശേഖരിക്കപ്പെടുന്നു.
അത് സാമ്പത്തികശാസ്ത്രം,
അത് എഞ്ചിനീയറിംഗോ
മെഡിസിനോ അല്ലെങ്കില്‍
മറ്റേതെങ്കിലും
ഫീല്‍ഡോ ആകട്ടെ,
നിങ്ങള്‍ വിവിധതരം
ഡാറ്റകള്‍ ശേഖരിക്കുന്നു.
ഡാറ്റ ശേഖരിക്കുന്നതിനുള്ള
ഉദ്ദേശ്യം അടിസ്ഥാനപരമായി
പ്രക്രിയയെക്കുറിച്ച്
അറിയാന്‍ കഴിയുമെന്നതാണ്.
പക്ഷേ, തീര്‍ച്ചയായും,
അത് ഒരേയൊരു ഉദ്ദേശ്യമല്ല.
ഞാന്‍ ഇവിടെ ലിസ്റ്റ്
ചെയ്തതുപോലെ, ഡാറ്റ
വിശകലനത്തിനായി
നിരവധി ഉദ്ദേശ്യങ്ങള്‍
ഉണ്ട്.

Marathi: 
सिद्धांताकडे जात
नाही, परंतु अर्थपूर्ण
परिणाम मिळवण्यासाठी
एखाद्याला अनुसरण
करण्याची आवश्यकता
आहे. सर्व प्रथम, आम्ही
विचारणे आवश्यक - डेटा
विश्लेषण काय आहे?
डेटाचे विश्लेषण
म्हणजे निरिक्षणांवरून
उपयुक्त, संबंधित
आणि अर्थपूर्ण माहिती
काढणे.
मी म्हटल्याप्रमाणे,
आम्ही विविध क्षेत्रातील
आणि वेगवेगळ्या स्वरूपात
डेटा गोळा करतो, मग
ते अर्थशास्त्र असो,
मग ते अभियांत्रिकी
किंवा औषधे असो वा
अन्य क्षेत्र असो,
आमच्याकडे विविध
प्रकारचे डेटा आहे
आणि डेटा गोळा करण्याचा
हेतू प्रक्रियेबद्दल
थोडी माहिती आहे;
पण, अर्थातच, हे एकमेव
उद्देश नाही. मी येथे
सूचीबद्ध केल्याप्रमाणे
डेटा विश्लेषणासाठी
अनेक उद्देश आहेत.
हे commomly असू शकते .. उदाहरणार्थ,
पॅरामीटर अनुमान
आम्ही विशिष्ट अज्ञात
inferring आहेत जेथे सामान्य
उद्देश, आणि मी येथे
मापदंड म्हणू तेव्हा,
तो फक्त मॉडेल घटक
नाही; हे पॅरामीटर्स
संख्याशास्त्रीय
गुणधर्मांचा देखील
उल्लेख करू शकते
ज्यास आम्हाला सामान्यतः
आवडते, जसे की सरासरी
- याचा अर्थ, परिवर्तनशीलता,

Kannada: 
ನಾವು ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸುತ್ತಿರುವಾಗ,
ಅದರಲ್ಲಿ ಒಂದು ಸಿದ್ಧಾಂತವಿದೆ
ಮತ್ತು ಸಹಜವಾಗಿ, ನಾವು
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ
ಸಿದ್ಧಾಂತದ ಮೇಲೆ ಹೋಗುತ್ತಿಲ್ಲ,
ಆದರೆ ಅರ್ಥಪೂರ್ಣ ಫಲಿತಾಂಶಗಳನ್ನು
ಪಡೆಯಲು ಅನುಸರಿಸಬೇಕಾದ
ವಿಧಾನ.
ಮೊದಲಿಗೆ, ನಾವು ಕೇಳಬೇಕಾಗಿದೆ
- ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
ಏನು?
ಡೇಟಾದ ವಿಶ್ಲೇಷಣೆ,
ಸಂಬಂಧಿತ ಮತ್ತು ಅರ್ಥಪೂರ್ಣ
ಮಾಹಿತಿಯನ್ನು ಹೊರತೆಗೆಯುವುದರ
ವೀಕ್ಷಣೆಗಳಿಂದ ಉಪಯುಕ್ತ.
ನಾನು ಹೇಳಿದಂತೆ, ನಾವು
ವಿಭಿನ್ನ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ
ಮತ್ತು ವಿಭಿನ್ನ ರೂಪಗಳಲ್ಲಿ
ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುತ್ತೇವೆ,
ಇದು ಆರ್ಥಿಕತೆ, ಎಂಜಿನಿಯರಿಂಗ್
ಅಥವಾ ಔಷಧ ಅಥವಾ ಯಾವುದೇ
ಕ್ಷೇತ್ರವಾಗಿದ್ದರೂ,
ನಾವು ಸಂಗ್ರಹಿಸಿದ
ವಿಭಿನ್ನ ಡೇಟಾವನ್ನು
ಮತ್ತು ಡೇಟಾವನ್ನು
ಸಂಗ್ರಹಿಸುವ ಉದ್ದೇಶವು
ಮೂಲಭೂತವಾಗಿ ಪ್ರಕ್ರಿಯೆಯ

Tamil: 
பல்வேறு வகையான தரவு
பகுப்பாய்வுகளை
மேற்கொள்ளக்கூடிய
பல மென்பொருள் தொகுப்புகள்
உள்ளன.
தரவுத் டேட்டா அனாலிசிஸ்
(Data Analysis) - நீங்கள் தரவுத்
தொகுப்புகளில் தரவுகளை
வீசி எடுப்பது மட்டுமல்லாமல்,
உருவாக்கப்படும்
ஆடம்பரமான வரைபடங்களில்
சிலவற்றைப் பற்றியும்,
உங்கள் கணினியில்
திரையில் கிடைக்கும்
சில நல்ல முடிவுகளைப்
பற்றியும், அது ஒரு
மிகச்சிறிய பகுதியாகும்.
தரவுகளை பகுப்பாய்வு
செய்வது போல், ஒரு
கோட்பாடு உள்ளது,
நிச்சயமாக, நாம்
தரவு பகுப்பாய்வு
கோட்பாட்டின் மீது
செல்லப் போவதில்லை,
ஆனால் அர்த்தமுள்ள

Gujarati: 
analysis), એનાલિસિસ(analysis)ના
પ્રકાર અને ડેટા
એનાલિસિસ(data analysis)માં
મળતાં વિવિધ પ્રકારની
માહિતી, અને અલબત્ત,
પદ્ધતિસરની પ્રક્રિયા
વિષે વાત કરીશું.

Hindi: 
हैं, और जब मैं यहां
पैरामीटर लेता हूं,
यह केवल मॉडल पैरामीटर
नहीं है; ये पैरामीटर
उन सांख्यिकीय गुणों
का भी उल्लेख कर सकते
हैं जिन्हें हम आम
तौर पर रुचि रखते
हैं, जैसे कि औसत - इसका
मतलब है, परिवर्तनशीलता,
वेरिएंट या मानक
विचलन, औसत और इसी
तरह।
तो, यहां शब्द पैरामीटर
बहुत सामान्य तरीके
से लिया जाना चाहिए।
अनिवार्य रूप से
यह एक अज्ञात है कि
हम डेटा से अनुमान
लगाने की कोशिश कर
रहे हैं।
जाहिर है, यह डेटा
विश्लेषण (DATA ANALYSIS)में
सामान्य अभ्यासों
में से एक है।
फिर, ज़ाहिर है, हमारे
पास सर्वव्यापी मॉडल
विकास है।
हम में से कई दो या
दो से अधिक चर के बीच
मॉडल विकसित करने
के लिए डेटा एकत्र
करते हैं।
और हम मॉडल क्यों
विकसित करते हैं?
ब्याज के चर की भविष्यवाणी
करने के लिए काफी
हद तक।
पूर्वानुमान के लिए
तकनीकी शब्द भी अर्थशास्त्र
और सामाजिक विज्ञान
में पूर्वानुमान
है; यह एक बहुत ही
आम शब्द है और यह अपने
आप में एक बड़ा क्षेत्र
है।
और फिर, हमारे पास
फीचर निष्कर्षण है।

Malayalam: 
ഇത് പൊതുവായി ഉള്ള
കാര്യങ്ങളാണ്.
ഉദാഹരണത്തിന് പരാമീറ്റര്‍
കണക്കാക്കുമ്പോള്‍
ചില അജ്ഞാത കാര്യങ്ങളെ
അനുമാനിക്കുകയും
ഇവിടെ പരാമീറ്ററുകളെക്കുറിച്ച്
പറയുമ്പോള്‍, അത്
മാതൃക മോഡലുകളല്ല;
ശരാശരി വൈവിദ്ധ്യത,
വ്യതിയാനങ്ങള്‍
അല്ലെങ്കില്‍ സ്റ്റാന്‍ഡേര്‍ഡ്
ഡീവിയേഷന്‍, മീഡിയന്‍
തുടങ്ങിയവ പോലുള്ള
ശരാശരി അളവുകള്‍
സാധാരണ താല്പര്യങ്ങളിലുള്ള
സ്റ്റാറ്റിസ്റ്റിക്കല്‍
സ്വഭാവവും ഈ പരാമീറ്ററുകള്‍ക്ക്
ഉപയോഗിക്കാം.
അതുകൊണ്ട് ഇവിടെ
പരാമീറ്റര്‍ വളരെ
സാധാരണരീതിയിലാണ്
ഉപയോഗിക്കേണ്ടത്.
അടിസ്ഥാനപരമായി
ഡാറ്റയില്‍ നിന്ന്
നിങ്ങള്‍ കണക്കാക്കാന്‍
ശ്രമിക്കുന്ന ഒരു
കാര്യം അജ്ഞാതമാണ്.
വ്യക്തമായും, അത്
ഡാറ്റ വിശകലനത്തിലെ
സാധാരണകാര്യങ്ങളിലൊന്നാണ്.
പിന്നെ, തീര്‍ച്ചയായും
എങ്ങനെയാണ് സര്‍വ്വവ്യാപകമായ
മോഡല്‍ വികസനം.
രണ്ടോ അതിലധികമോ
വേരിയബിളുകള്‍ തമ്മിലുള്ള
മോഡല്‍ വികസിപ്പിക്കുന്നതിനായി
നമ്മളില്‍ പലരും
ഡാറ്റ ശേഖരിക്കുന്നു.
എന്തിനാണ് നമ്മള്‍
മോഡലുകള്‍ വികസിപ്പിക്കുന്നത്?
കൂടുതലായും പലിശയുടെ
വേരിയബിളിനെക്കുറിച്ച്
മുന്‍കൂട്ടി പറയാന്‍
വേണ്ടി പ്രവചനങ്ങള്‍ക്കുള്ള
സാങ്കേതികപദം സാമ്പത്തികശാസ്ത്രവും
സാമൂഹ്യശാസ്ത്രവും
കൂടിയും പ്രവചിക്കുന്നു.

Marathi: 
रूपे किंवा मानक
विचलन, मध्यक आणि
इतकेच.
म्हणून, येथे टर्म
परिमाणे अतिशय सामान्य
पद्धतीने घेतली पाहिजे.
मूलत: हा अज्ञात आहे
की आम्ही डेटावरून
अंदाज लावण्याचा
प्रयत्न करीत आहोत.
स्पष्टपणे, डेटा
विश्लेषणातील हे
सामान्य व्यायामांपैकी
एक आहे. मग नक्कीच
आपल्याकडे सर्वव्यापी
मॉडेलचे विकास आहे.
आम्हाला दोन किंवा
अधिक चलने दरम्यान
मॉडेल विकसित डेटा
गोळा आणि आम्ही मॉडेल
विकसित का?
व्याज व्हेरिएबलची
भाकीत करण्याबद्दल
पूर्वानुमाननासाठी
तांत्रिक संज्ञा
देखील अर्थमॅट्रिक्स
आणि सामाजिक विज्ञान
मध्ये देखील अंदाज
आहे; तो एक अतिशय सामान्य
शब्द आहे आणि तो स्वतःच
एक प्रचंड फील्ड
आहे. आणि मग, आपल्याकडे
वैशिष्ट्य वेचा आहे
तर, आपण उदाहरणार्थ,
ईसीजी किंवा ईईजी
डेटासारखी बायोमेडिकल
डेटा घेतल्यास ईसीजी
डेटामध्ये आपण पाहिले
किंवा नसलो तरी, पण
ईसीजी हे असे काहीतरी
आहे की आपण हे शोधू
या की ते आमच्या संशोधन
कार्याचा एक भाग

English: 
types of data collected and the purpose of
collecting data is basically to know something
about the process; but, of course, that’s
not the only purpose. As I have listed here,
there are several purposes to data analysis.
It could be commomly.. common purposes, for
example, parameter estimation where we are
inferring certain unknowns, and when I say
parameters here, it is not just model parameters;
these parameters could also refer to statistical
properties that we are commonly interested
in, such as averages - that is mean, variability,
variants or standard deviation, median and
and so on. So, the term parameter here should
be taken in a very generic manner. Essentially
it’s an unknown that we are trying to estimate
from data. Obviously, that’s one of the
common exercises in data analysis.
Then, of course, we have the ubiquitous model
development. Many of us collect data to develop

Bengali: 
অন্য সংগ্রহ করে
এমনকি যদি এটি তাত্ত্বিক
গবেষণা হয়, তবে কিছু
সময়ের মধ্যে, কিছুটা
পরীক্ষামূলকভাবে
কাজ করা তত্ত্বকে
সংজ্ঞায়িত করা হয়।
বড় এবং বৃহৎ, আপনি
যদি আজকে দেখেন, তাহলে
দৃশ্যের তথ্য বিশ্লেষণগুলি
সম্পর্কে।
অনেক তথ্য শুধুমাত্র
প্রকৌশল বিভাগে উৎপন্ন

Tamil: 
முடிவுகளைப் பெறுவதற்கு
பின்பற்ற வேண்டிய
செயல்முறை பற்றி
பார்ப்போம்.
முதலில், நாம் கேட்க
வேண்டும் - தரவு பகுப்பாய்வு
என்ன?
தரவுகளின் பகுப்பாய்வு,
பயனுள்ள, பொருத்தமான,
அர்த்தமுள்ள தகவலை
கவனத்தில் இருந்து
பிரித்தெடுக்கிறது.
நான் சொன்னது போல,
பல்வேறு துறைகளிலும்,
பல்வேறு வடிவங்களிலும்
தரவுகளை சேகரிக்கிறோம்.
அது பொருளாதாரம்,
இன்ஜினியரிங் (Engineering),
மருத்துவம் (Medicine)
அல்லது வேறெந்த துறையில்
இருந்தாலும், சேகரிக்கப்பட்ட
பல்வேறு வகை தரவுகளைக்
கொண்டிருக்கிறது.
தரவு சேகரிப்பது
முக்கியமாக செயலாக்கத்தைப்
பற்றி தெரிந்துகொள்ள
வேண்டும்; ஆனால்,

Gujarati: 
અમે ભાષણને બે પ્રાયોગિક
​​ઉદાહરણો સાથે સમાપ્ત
કરી શકીએ છીએ જે ભાષામાં
અથવા આર પ્લેટફોર્મમાં
સોફ્ટવેર પ્લેટફોર્મમાં
છે જે આંકડાકીય માહિતી

English: 
models between two or more variables. And
why do we develop models? Largely for predicting
the variable of interest. Technical term for
prediction is also called is also forecasting
in econometrics and social sciences; it’s
a very common term and that’s a huge field
in itself. And then, we have feature extraction.
So, if you take, for example, biomedical data,
such as ECG or EEG data. In ECG data whether
we have seen or not, but ECG is something
that we all get to see whether it’s a part
of our research work or not. It’s related
to our human health, and if you see, if you
recall ECG is a train, is a pulse, train of
pulses which has regular peaks in it and we
would like to extract those features. A doctor
who looks at ECG essentially searches for
those peaks, and also searches for anomalies

Bengali: 
হয় নি, তবে প্রতিটি
স্থানে, এবং সেইজন্য,
একটি পদ্ধতিগত পদ্ধতিতে
ডেটা বিশ্লেষণ কিভাবে
বুঝতে হবে।
অনেকগুলি সফ্টওয়্যার
প্যাকেজ রয়েছে যা
বিভিন্ন ধরণের ডেটা
বিশ্লেষণ করতে পারে।
এবং কেউ মনে রাখতে
হবে যে বিশ্লেষণ
ডেটা কেবল সফ্টওয়্যার
প্যাকেজে ডেটা ছুঁড়ে
ফেলছে না, এবং তারপর,
কিছু ফ্যানিশ গ্রাফ

Malayalam: 
ഇത് ഒരു സാധാരണപദമാണ്,
അത് തന്നെ ഒരു വലിയ
മേഖലയാണ്.
അതിന് ശേഷം നമുക്ക്
ഫീച്ചര്‍ എക്സ്ട്രാക്ഷന്‍
ഉണ്ട്.
ഉദാഹരണമായി, ECG അല്ലെങ്കില്‍
EEG ഡാറ്റ പോലൂള്ള
ബയോമെഡിക്കല്‍ ഡാറ്റ
നിങ്ങള്‍ സ്വീകരിക്കുകയാണെങ്കില്‍
നമ്മള്‍ ഇസിജി ഡാറ്റ
കണ്ടിട്ടുണ്ടോ ഇല്ലയോ
എന്നതല്ല, അത് നിങ്ങളുടെ
ഗവേഷണ പ്രവര്‍ത്തനത്തിന്‍റെ
ഭാഗമാണോ അല്ലയോ എന്ന്
നമ്മള്‍ എല്ലാവരും
മനസ്സിലാക്കണം.
അത് നമ്മുടെ ആരോഗ്യവുമായി
ബന്ധപ്പെട്ടതാണ്.
ECG ഒരു ട്രെയിന്‍
ആണെങ്കില്‍, ഒരു
പള്‍സ്, പള്‍സുകളുടെ
ട്രെയിനുകള്‍ അതില്‍
പതിവ് കൊടുമുടികള്‍
ഉണ്ട്, ആ സവിശേഷതകളെ
വേര്‍തിരിച്ചെടുക്കാന്‍
നമ്മള്‍ ആഗ്രഹിക്കുന്നു.
ഇസിജിയില്‍ കാണുന്ന
ഒരു ഡോക്ടര്‍ ആ കൊടുമുടികള്‍
തിരഞ്ഞുകൊണ്ടിരിക്കുന്നു.
കൂടാതെ അവയിലുണ്ടാകുന്ന
വ്യതിയാനങ്ങള്‍ക്കായി
തിരയുന്നു.
അത്തരം വ്യതിയാനങ്ങല്‍
അനാരോഗ്യകരമായ ഹൃദയത്തെ
സൂചിപ്പിക്കാന്‍
കഴിയും.
അതിനാല്‍, ഫീച്ചര്‍
വേര്‍തിരിച്ചെടുക്കുന്നത്
വളരെ സാധാരണമാണ്.
ബയോമെഡിക്കലില്‍
മാത്രമല്ല, എല്ലായിടത്തും
കൂടാതെ വര്‍ഗ്ഗീകരണം
നമ്മള്‍ സവിശേഷതകള്‍

Kannada: 
ಬಗ್ಗೆ ಏನಾದರೂ ತಿಳಿಯುವುದು;
ಆದರೆ, ಇದು ಕೇವಲ ಉದ್ದೇಶವಲ್ಲ.
ನಾನು ಇಲ್ಲಿ ಪಟ್ಟಿ
ಮಾಡಿದಂತೆ, ಮಾಹಿತಿ
ವಿಶ್ಲೇಷಣೆಗೆ ಹಲವಾರು
ಉದ್ದೇಶಗಳಿವೆ.
ಇದು ಸಾಮಾನ್ಯವಾಗಿರಬಹುದು
.. ಸಾಮಾನ್ಯ ಉದ್ದೇಶಗಳು,
ಉದಾಹರಣೆಗೆ, ನಾವು
ಕೆಲವು ಅಜ್ಞಾತರಿಗೆ
ಅಲ್ಲಿರುವ ಪ್ಯಾರಾಮೀಟರ್
ಅಂದಾಜು, ಮತ್ತು ನಾನು
ಇಲ್ಲಿ ನಿಯತಾಂಕಗಳನ್ನು
ಹೇಳಿದಾಗ ಅದು ಕೇವಲ
ಮಾದರಿ ನಿಯತಾಂಕಗಳಲ್ಲ;
ಈ ನಿಯತಾಂಕಗಳು ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ
ಗುಣಲಕ್ಷಣಗಳನ್ನು
ಕೂಡಾ ನಾವು ಸಾಮಾನ್ಯವಾಗಿ
ಆಸಕ್ತಿ ಹೊಂದಿರುವ
ಸರಾಸರಿಗಳಂತೆ - ಅಂದರೆ
ಸರಾಸರಿ, ವ್ಯತ್ಯಾಸ,
ರೂಪಾಂತರಗಳು ಅಥವಾ
ಪ್ರಮಾಣಿತ ವಿಚಲನ,
ಮಧ್ಯಮ ಮತ್ತು ಅದಕ್ಕಿಂತಲೂ
ಹೆಚ್ಚು.
ಆದ್ದರಿಂದ, ಇಲ್ಲಿ
ಪದ ನಿಯತಾಂಕವನ್ನು

Marathi: 
आहे किंवा नाही. हे
आमच्या मानवी आरोग्याशी
निगडीत आहे आणि आपण
पाहिल्यास, आपल्याला
ईसीजी आठवते असेल
तर एक गाडी आहे, ते
एक कळी आहे, ज्यामध्ये
दागांची नियमित शिखर
आहे आणि आम्ही ती
वैशिष्ट्ये काढू
इच्छितो.
इ.स.पू. पाहणा-या डॉक्टरांना
हे शिखर शोधले जातात
आणि त्या शिखरांमध्ये
अनियमितता शोधते,
आणि त्या विकृती
एक अस्वस्थ हृदयाचे
संकेत असू शकतात.
तर, वैशिष्ट्यपूर्ण
निष्कर्ष अतिशय सामान्य
आहे, केवळ जैववैद्यकच
नव्हे तर सर्वत्र.
वर्गीकरण एकदा आम्ही
वैशिष्ट्ये काढू,
आम्ही प्रतिमा वर्गीकृत
करू इच्छितो.
प्रतिमा विश्लेषणात,
हे एक अतिशय सामान्य
व्यायाम आहे. आम्ही
लोकांना समान रंग,
केसांचा रंग, तत्सम
डोळ्यांचा रंग आणि
चेहर्यावरील त्वचा
रंग आणि अशाच प्रकारचे
वर्गीकरण करण्याचा
प्रयत्न करतो. आणि
मग, हे सर्व मध्यवर्ती
अशी गृहीते चाचणी
आहे. अभिप्राय तपासणी
म्हणजे काय?
डेटा विश्लेषणात
हा एक अतिशय सामान्य

Hindi: 
इसलिए, यदि आप लेते
हैं, उदाहरण के लिए,
ईसीजी या ईईजी डेटा
जैसे बायोमेडिकल
डेटा।
ईसीजी डेटा में हमने
देखा है या नहीं, लेकिन
ईसीजी ऐसा कुछ है
जिसे हम सभी को यह
देखने के लिए मिलता
है कि यह हमारे शोध
कार्य का हिस्सा
है या नहीं।
यह हमारे मानव स्वास्थ्य
से संबंधित है, और
यदि आप देखते हैं,
यदि आपको याद है कि
ईसीजी एक ट्रेन है,
जिसमें नियमित चोटियां
होती हैं और हम उन
सुविधाओं को निकालना
चाहते हैं।
एक डॉक्टर जो ईसीजी
को देखता है, अनिवार्य
रूप से उन चोटियों
की खोज करता है, और
उन चोटियों में विसंगतियों
की खोज करता है, और
उन विसंगतियों को
अस्वास्थ्यकर दिल
का संकेत हो सकता
है, उदाहरण के लिए।
तो, फीचर निष्कर्षण
बहुत ही सामान्य
है, न केवल बायोमेडिकल
में, बल्कि हर जगह।
और वर्गीकरण।
एक बार जब हम सुविधाओं
को निकाल देते हैं,
तो हम छवि वर्गीकृत
करना चाहते हैं।
छवि विश्लेषण में,
यह एक बहुत ही आम व्यायाम
है।
हम समान रंग, बालों
के रंग, समान आंखों

Bengali: 
তৈরি করে এবং আপনার
কম্পিউটার স্ক্রিনে
পাওয়া কিছু চমৎকার
ফলাফল রিপোর্ট করে
- এটি ডেটা বিশ্লেষণ
নয়; এটা শুধু যে ব্যায়াম
একটি খুব ক্ষুদ্র
অংশ।
যতটা আমরা তথ্য বিশ্লেষণ
করছি, এটি একটি তত্ত্ব
আছে, এবং অবশ্যই, আমরা
তথ্য বিশ্লেষণ তত্ত্ব

Malayalam: 
എക്സ്ട്രാക്ട് ചെയ്താല്‍,
ഇമേജ് വേര്‍തിരിക്കാന്‍
ആഗ്രഹിക്കുന്നു.
ചിത്രവിശകലനം ഇത്
വളരെ സാധാരണ കാര്യമാണ്.
സമാനനിറങ്ങള്‍, മുടി
നിറങ്ങള്‍, സമാനമായ
കണ്ണുകള്‍, മുഖചര്‍മ്മനിറങ്ങള്‍
തുടങ്ങിയവ ഉപയോഗിച്ച്
ആളുകളെ വര്‍ഗ്ഗീകരിക്കാന്‍
നമ്മള്‍ ശ്രമിക്കുന്നു.
അതിനുശേഷം ഇതൊരു
കേന്ദ്രീകൃത ഹൈപ്പോതിസിസ്
ടെസ്റ്റിംഗ് പരീക്ഷണമാണ്.
എന്താണ് ഹൈപ്പോതിസീസ്
ടെസ്റ്റിംഗ്?
ഇത് ഡാറ്റ വിശകലനത്തില്‍
വളരെ സാധാരണമായ ഒരു
പ്രവര്‍ത്തനമാണ്.
അവിടെ ഗവേഷകന്‍ ചില
സത്യങ്ങള്‍ അവതരിപ്പിക്കുന്നു.
ഉദാഹരണമായി, ഞാന്‍
ആമ്പിയന്‍റ് താപനില
ഡാറ്റ ശേഖരിക്കുന്നുവെന്ന്
കരുതുക.
എന്‍റെ റൂമിന് പുറത്ത്
ഞാന്‍ ഒരു സെന്‍സര്‍
എടുത്തു ഒരു മണിക്കൂറില്‍
ആമ്പിയന്‍റ് ടെമ്പറേച്ചര്‍
ശേഖരിക്കുന്നു.
ഞാന്‍ തിരിച്ചുവന്ന്,
ഒരു മണിക്കൂറില്‍
ശരാശരി താപനില 25 ഡിഗ്രി
സെല്‍ഷ്യസ് ആണെന്ന്
അനുമാനിക്കുന്നു.
ഞാന്‍ ശേഖരിച്ചിട്ടുള്ള
ഡാറ്റയുടെ അടിസ്ഥാനത്തില്‍
ഈ അനുമാനം ശരിയാണോ
അല്ലയോ എന്ന കാര്യം
ഹൈപ്പോതിസീസ് ടെസ്റ്റിംഗിലൂടെ
പരിശോധിക്കുന്നു.

Marathi: 
अभ्यास आहे, जिथे
संशोधक काहीतरी सत्य
असल्याची बतावणी
करतो. उदाहरणार्थ,
मी समीपवर्धक तापमान
डेटा गोळा करतो असे
समजा. ते माझ्या खोलीच्या
बाहेर आहे, मी एक सेन्सर
घेतो आणि सुमारे
एक तास किंवा त्यापेक्षा
जास्त तापमानाचा
गोळा गोळा करू शकतो.
आणि मी परत येऊन ते
एक तास 25 डिग्री सेल्सियस
दरम्यान सरासरी तापमान
आहे हे सांगणे आता
हे एक सत्य आहे की
मी सरासरी तापमानासाठी
अनुकूल करतो. आणि
गृहितक चाचणी म्हणजे
मी संग्रहित केलेल्या
डेटाच्या आधारावर,
दावा केला आहे की
मी तो बनवत आहे किंवा
नाही हे मी बनवत आहे.
तर, मी गोळा केलेला
डेटा पुरावा म्हणून
कार्य करते आणि मी
माझ्या गृहितेच्या
समर्थनासाठी डेटामध्ये
पुरावा शोधतो आणि
त्यास सांख्यिकीय
स्वरुपाच्या पद्धतीने
केले पाहिजे.
आणि अभिकल्पना चाचणी
प्रत्येक सांख्यिकीय
हिशेबाच्या व्यायामाचा
अविभाज्य भाग आहे.
त्यामध्ये नक्कीच
खूप सिद्धांत, संभाव्यता

Kannada: 
ಬಹಳ ಸಾಮಾನ್ಯ ರೀತಿಯಲ್ಲಿ
ತೆಗೆದುಕೊಳ್ಳಬೇಕು.
ಮೂಲದಿಂದ ನಾವು ಮಾಹಿತಿಯಿಂದ
ಅಂದಾಜು ಮಾಡಲು ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದೇವೆ
ಎಂಬುದು ಅಜ್ಞಾತವಾಗಿದೆ.
ನಿಸ್ಸಂಶಯವಾಗಿ, ಇದು
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಸಾಮಾನ್ಯ ವ್ಯಾಯಾಮಗಳಲ್ಲಿ
ಒಂದಾಗಿದೆ.
ನಂತರ, ವಾಸ್ತವವಾಗಿ,
ಸರ್ವತ್ರ ಮಾದರಿ ಅಭಿವೃದ್ಧಿ
ಹೊಂದಿವೆ.
ಎರಡು ಅಥವಾ ಹೆಚ್ಚು
ವ್ಯತ್ಯಾಸಗಳ ನಡುವೆ
ಮಾದರಿಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸಲು
ನಮ್ಮಲ್ಲಿ ಹಲವರು ಡೇಟಾವನ್ನು
ಸಂಗ್ರಹಿಸುತ್ತೇವೆ.
ಮತ್ತು ಏಕೆ ನಾವು ಮಾದರಿಗಳನ್ನು
ಅಭಿವೃದ್ಧಿಪಡಿಸುತ್ತೇವೆ?
ಆಸಕ್ತಿಯ ವೇರಿಯಬಲ್
ಅನ್ನು ಊಹಿಸಲು ಹೆಚ್ಚು.
ಮುನ್ಸೂಚನೆಯ ತಾಂತ್ರಿಕ
ಪದವನ್ನು ಸಹ ಅರ್ಥಶಾಸ್ತ್ರ
ಮತ್ತು ಸಾಮಾಜಿಕ ವಿಜ್ಞಾನಗಳಲ್ಲಿ
ಮುಂಗಾಣಲಾಗಿದೆ ಎಂದು
ಕರೆಯಲಾಗುತ್ತದೆ; ಇದು
ಬಹಳ ಸಾಮಾನ್ಯ ಪದ ಮತ್ತು

Hindi: 
के रंग, और चेहरे की
त्वचा के रंग वाले
लोगों को वर्गीकृत
करने की कोशिश करते
हैं।
और फिर, यह सब केंद्रीय
है परिकल्पना परीक्षण
है।
परिकल्पना परीक्षण
क्या है?
यह डेटा विश्लेषण
(DATA ANALYSIS)में एक बहुत
ही सामान्य अभ्यास
है, जहां शोधकर्ता
सत्य को कुछ बना रहा
है।
उदाहरण के तौर पर,
मान लीजिए कि मैं
परिवेश तापमान डेटा
एकत्र करता हूं।
यह मेरे कमरे के बाहर
है, मैं एक सेंसर लेता
हूं और लगभग एक घंटे
या उससे भी अधिक समय
तक परिवेश का तापमान
इकट्ठा करता हूं।
और मैं वापस आकर पोस्ट
करता हूं कि उस घंटे
के दौरान औसत तापमान
25 डिग्री सेल्सियस
है।
अब यह एक सच्चाई है
जिसे मैं औसत तापमान
के लिए स्थगित करता
हूं और परिकल्पना
परीक्षण के बारे
में है जो दावा करता
है कि मैं एकत्र कर
रहा हूं या नहीं, जो
मैंने एकत्र किए
गए डेटा के आधार पर
किया है या नहीं।
इसलिए, मैंने जो डेटा
एकत्र किया है वह
सबूत के रूप में कार्य
करता है और मैं अपनी

Gujarati: 
એનાલિસિસ(analysis) માટે
એક ઓપન સોર્સ(open source)
ફ્રી સૉફ્ટવેર છે.
હવે, આગળ વધતાં પહેલાં,

Tamil: 
நிச்சயமாக, அது ஒரே
நோக்கம் அல்ல. நான்
இங்கே பட்டியலிட்டிருக்கிறேன்,
தரவு பகுப்பாய்வு
பல நோக்கங்களுக்காக
உள்ளன.
இது பொதுவானதாக இருக்கலாம்.
உதாரணமாக, குறிப்பிட்ட
சில காரணங்களைக்
குறிப்பிடும் அளவுரு
மதிப்பீடு, நான்
இங்கே அளவுருக்கள்
என்று கூறும்போது,
​​இது மாதிரி அளவுருக்கள்
அல்ல; இந்த அளவுருக்கள்
பொதுவாக சராசரியாக,
அதாவது மாறுபாடு,
மாறுபாடுகள் அல்லது
நியமச்சாய்வு, இடைநிலை
மற்றும் பலவற்றைப்
போன்ற சராசரி ஆர்வமுள்ள
புள்ளியியல் பண்புகளைக்
குறிக்கலாம்.

English: 
in those peaks, and those anomalies could
be indication of an unhealthy heart, for example.
So, feature extraction is very common, not
just of course in biomedical, but everywhere.
And classification. Once we extract features,
we would like to classify image. In image
analysis, this is a very very common exercise.
We try to classify people with similar colors,
hair colors, similar eye color, and facial
skin color and so on.
And then, central to all of this is hypothesis
testing. What is hypothesis testing? It’s
a very, very common exercise in data analysis,
where the researcher postulates the truth
being something. As an example, suppose I
collect ambient temperature data. That is
outside my room, I take a sensor and collect
ambient temperature for about may be an hour

Gujarati: 
હું તમને કહું છુ
કે ડેટા એનાલિસિસ(data
analysis) કોઈપણ સંશોધન
કાર્યનો એક અભિન્ન
ભાગ છે. દરેક પ્રકારનાં
સંશોધનમાં જે એક

Kannada: 
ಅದು ಸ್ವತಃ ಒಂದು ದೊಡ್ಡ
ಕ್ಷೇತ್ರವಾಗಿದೆ.
ತದನಂತರ, ನಾವು ವೈಶಿಷ್ಟ್ಯವನ್ನು
ಹೊರತೆಗೆಯಲು ಹೊಂದಿವೆ.
ಆದ್ದರಿಂದ, ನೀವು ECG
ಅಥವಾ EEG ಡೇಟಾದಂತಹ
ಬಯೋಮೆಡಿಕಲ್ ಡೇಟಾವನ್ನು
ತೆಗೆದುಕೊಂಡರೆ.
ಇಸಿಜಿ ಡೇಟಾದಲ್ಲಿ
ನಾವು ನೋಡಿದ್ದೇವೆಯೇ
ಅಥವಾ ಇಲ್ಲವೋ, ಆದರೆ
ಇಸಿಜಿ ನಮ್ಮ ಸಂಶೋಧನಾ
ಕಾರ್ಯದ ಭಾಗವೇ ಅಥವಾ
ಇಲ್ಲವೇ ಎಂದು ನಾವು
ಎಲ್ಲರೂ ನೋಡುತ್ತೇವೆ.
ಇದು ನಮ್ಮ ಮಾನವ ಆರೋಗ್ಯಕ್ಕೆ
ಸಂಬಂಧಿಸಿದೆ, ಮತ್ತು
ನೀವು ನೋಡಿದರೆ, ECG ಯು
ರೈಲು ಎಂದು ನೀವು ನೆನಪಿಸಿದಲ್ಲಿ,
ನಾಡಿ, ಅದರಲ್ಲಿ ನಿಯಮಿತ
ಶಿಖರಗಳನ್ನು ಹೊಂದಿರುವ
ಧಾನ್ಯಗಳ ರೈಲು ಮತ್ತು
ಆ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು
ಹೊರತೆಗೆಯಲು ನಾವು
ಬಯಸುತ್ತೇವೆ.

Marathi: 
सिद्धांत, अंदाज
सिद्धांत आणि इतकेच
समाविष्ट आहे. आम्ही
नाही, आम्ही गृहीते
चाचणीत सखोल जाणार
नाही आणि इत्यादी.
अभिप्राय तपासणीच्या
परिचयावर आम्ही शिकलो
असा एक एमओसी कोर्स
आहे; ते कदाचित मार्चच्या
दुसऱ्या किंवा तिसऱ्या
आठवड्यात कदाचित
सुरु होईल. आणि आपल्याला
स्वारस्य असल्यास,
आपण त्यातून बसावे
कारण प्रत्येक सांख्यिकीय
माहिती विश्लेषण
व्यायाम हा एक अविभाज्य
भाग आहे. नंतर, आमच्याकडे
डेटा विश्लेषण संभवत:
फॉल्ट डिटेक्शनसाठी
केला जात आहे. मी आधी
सांगितल्याप्रमाणे,
डॉक्टर जेव्हा ईसीजीकडे
पाहतात तेव्हा डॉक्टर
विसंगती शोधत असतो
किंवा जेव्हा रेडिओलॉजिस्ट
एक्स-रेकडे पाहत
असतो, तेव्हा काही
मॉडेल किंवा काही
सामान्य परिस्थिती
लक्षात ठेवून विसंगती
शोधत असतो, तेव्हा
ते प्रोजेक्ट करते.
सामान्य टेम्पलेटवरील
वर्तमान डेटा. आणि
त्या पद्धतीने फॉल्ट
डिटेक्शन सर्वत्र
चालते.
तरीही प्रक्रिया
उद्योगात परिस्थिती
आहे म्हणून, याला
प्रोसेस मॉनिटरिंग
म्हणून देखील ओळखले
जाते. आणि डेटा विश्लेषनांमध्ये
लिहता येण्यासाठी
अनेक उद्देश आहेत,

Tamil: 
எனவே, இங்கே கால அளவுரு
மிகவும் பொதுவான
முறையில் எடுக்கப்பட
வேண்டும்.
முக்கியமாக நாம்
தரவு இருந்து மதிப்பீடு
செய்ய முயற்சி என்று
தெரியவில்லை தான்.
வெளிப்படையாக, இது
தரவு பகுப்பாய்வு
பொதுவான பயிற்சிகள்
ஒன்றாகும்.
பின்னர், நிச்சயமாக,
எங்கும் எழும் மாதிரி
வளர்ச்சி.
இரண்டு அல்லது அதற்கு
மேற்பட்ட மாறிகளுக்கு
இடையேயான மாதிரியை
உருவாக்க பலர் தரவு
சேகரிக்கிறார்கள்.
நாம் ஏன் மாதிரியை
உருவாக்குகிறோம்?
விருப்பம் மாறி கணிக்க
தொழில்நுட்ப காலமும்
பொருளாதாரம் மற்றும்
சமூக அறிவியல் ஆகியவற்றிலும்
முன்னறிவிப்பு செய்யப்படுகிறது.

Hindi: 
परिकल्पना का समर्थन
करने के लिए डेटा
में साक्ष्य की खोज
करता हूं, और इसे सांख्यिकीय
रूप से अच्छी तरह
से किया जाना चाहिए।
और परिकल्पना परीक्षण
प्रत्येक सांख्यिकीय
अवधारणा अभ्यास का
एक अभिन्न हिस्सा
है।
इसमें, ज़ाहिर है,
बहुत सारे सिद्धांत,
संभाव्यता सिद्धांत,
आकलन सिद्धांत और
इसी तरह से।
हम परिकल्पना परीक्षण
में गहराई में नहीं
जाएंगे और इसी तरह।
एक MOOC पाठ्यक्रम है
जो हम परिकल्पना
परीक्षण के परिचय
पर सीखते हैं; यह मार्च
के दूसरे या तीसरे
सप्ताह में शुरू
होगा।
और यदि आप रुचि रखते
हैं, तो आपको इसके
माध्यम से बैठना
चाहिए क्योंकि यह
प्रत्येक सांख्यिकीय
डेटा विश्लेषण (DATA
ANALYSIS)अभ्यास का एक
अभिन्न अंग है।
क्योंकि यह प्रत्येक
सांख्यिकीय डेटा
विश्लेषण (DATA ANALYSIS)अभ्यास
का एक अभिन्न हिस्सा
है।
फिर, हमारे पास गलती
का पता लगाने के लिए
शायद डेटा विश्लेषण
(DATA ANALYSIS)किया जा रहा
है।
जैसा कि मैंने पहले
बताया था, एक डॉक्टर,
जब डॉक्टर ईसीजी
को देखता है, तो विसंगतियों
की तलाश में है या
जब रेडियोलॉजिस्ट
एक्स-रे को देख रहा
है, तो कुछ मॉडल या
सामान्य परिस्थितियों
के कुछ टेम्पलेट

Bengali: 
উপর যেতে না হয়, কিন্তু
এক যে অর্থপূর্ণ
ফলাফল পেতে অনুসরণ
করা প্রয়োজন যে
পদ্ধতি।
প্রথমত, আমাদের জিজ্ঞাসা
করতে হবে - তথ্য বিশ্লেষণ
কি?
তথ্য বিশ্লেষণ সম্পর্কে
পর্যবেক্ষণ থেকে
দরকারী, প্রাসঙ্গিক,
এবং অর্থবহ তথ্য
আহরণ করা হয়।
আমি বলেছি, আমরা বিভিন্ন
গোলক এবং বিভিন্ন

Malayalam: 
അതിനാല്‍, ഞാന്‍
ശേഖരിച്ചിട്ടുള്ള
ഡാറ്റ ഒരു തെളിവായി
വര്‍ത്തിക്കുന്നു.
എന്‍റെ സിദ്ധാന്തത്തിന്
പിന്തുണ നല്‍കുന്ന
ഡാറ്റയില്‍ തെളിവുകള്‍ക്കായി
ഞാന്‍ തിരയുന്നു.
അത് സ്ഥിതിവിവരക്കണക്കനുസരിച്ചുള്ള
രീതിയില്‍ ചെയ്യേണ്ടതുണ്ട്.
എല്ലാ പരികല്പനാ
സംബന്ധമായ പ്രവര്‍ത്തനത്തില്‍
ഒരു അവിഭാജ്യഘടകമാണ്
ഹൈപ്പോതിസീസ് ടെസ്റ്റിംഗ്.
ഇതില്‍ ഒരുപാട് സിദ്ധാന്തങ്ങള്‍
പ്രവചനസിദ്ധാന്തം,
മൂല്യനിര്‍ണ്ണയസിദ്ധാന്തം
എന്നിവയും ഉള്‍പ്പെടുന്നു.
നമ്മള്‍ പരികല്പനാ
പരിശോധനയില്‍ ആഴത്തില്‍
പ്രവേശിക്കുന്നില്ല.
ഒരു MOOC കോഴ്സുണ്ട്.
അതില്‍ നമ്മള്‍ ഹൈപ്പോതിസീസ്
ടെസ്റ്റിംഗിനെക്കുറിച്ച്
പഠിക്കും.
അത് മാര്‍ച്ചിന്‍റെ
രണ്ടാം അല്ലെങ്കില്‍
മൂന്നാമത്തെ ആഴ്ചയില്‍
ആരംഭിക്കും.
നിങ്ങള്‍ താല്പര്യപ്പെടുകയാണെങ്കില്‍
അതില്‍ പങ്കെടുക്കാം.
കാരണം ഓരോ സ്റ്റാറ്റിസ്റ്റിറ്റിക്കല്‍
ഡേറ്റ അനാലിസിസിന്‍റെയും
അവിഭാജ്യഭാഗമാണത്.
അപ്പോള്‍, തെറ്റുകളെ
കണ്ടെത്തുന്നതിനായി
ഒരു പക്ഷേ ചെയ്യപ്പെടുന്ന
ഡാറ്റ വിശകലനം ഉണ്ട്.
ഞാന്‍ നേരത്തെ വിശദീകരിച്ചതുപോലെ,
ഒരു ഡോക്ടര്‍ ഇസിജി
നോക്കുമ്പോള്‍ വ്യതിയാനങ്ങളെ
ശ്രദ്ധിക്കുന്നു
അല്ലെങ്കില്‍ ഒരു
റേഡിയോളജിസ്റ്റ്

English: 
or so. And I come back and postulate that
the average temperature during that one hour
is 25 degrees Celsius. Now that’s a truth
that I postulate for the average temperature.
And hypothesis testing is about testing that
claim that I am making whether it holds or
not, based on the data that I collected. So,
the data I have collected serves as an evidence
and I search for evidence in the data to support
my hypothesis, and that has to be done in
statistically sound manner. And hypothesis
testing is an integral part of every statistical
inferencing exercise. That involves, of course,
a lot of theory, probability theory, estimation
theory and so on. We don’t, we will not
go into depth in hypothesis testing and so
on.
There is a MOOC course that we learn on introduction
to hypothesis testing; that will begin perhaps
in the second or third week of March. And

Gujarati: 
કરે છે, અચૂકપણે, કેટલાક
ડેટા અથવા અન્ય એકત્રિત
કરે છે. જો તે સૈદ્ધાંતિક
સંશોધન હોય તો પણ,
સમયાંતરે, વિકસિત
કરવામાં આવેલી સિદ્ધાંતને

English: 
if you are interested, you should sit through
it because it is an integral part of every
statistical data analysis exercise.
Then, we have data analysis being carried
out probably for fault detection. As I explained
earlier, a doctor, when the doctor looks at
the ECG, is looking for anomalies or when
a radiologist is looking at the x-ray, looking
for anomalies based on some model or some
template of normal conditions in mind, keeps
projecting the present data on to the normal
template. And that is how typically fault
detection is carried out everywhere; even
in process industry that is the situation.
So, this is also known as Process Monitoring.
And there are several purposes that one can
list in data analysis, but these primarily
cover most of the applications of data analysis.

Bengali: 
ফর্মের তথ্য সংগ্রহ
করি, এটি অর্থনীতি,
এটি প্রকৌশল বা ঔষধ
বা অন্য কোন ক্ষেত্র
কিনা, আমাদের বিভিন্ন
ধরনের তথ্য সংগ্রহ
করা হয় এবং তথ্য
সংগ্রহের উদ্দেশ্য
প্রাথমিকভাবে প্রক্রিয়া
সম্পর্কে কিছু জানা
যায়; কিন্তু, অবশ্যই,
এটি একমাত্র উদ্দেশ্য
নয়।
আমি এখানে তালিকাভুক্ত
হিসাবে, তথ্য বিশ্লেষণের

Tamil: 
அது மிகவும் பொதுவான
காலமாகும், அதுவே
ஒரு பெரிய துறையாகும்.
பின்னர், நாம் அம்சம்
பிரித்தெடுத்தல்
வேண்டும்.
உதாரணமாக, ஈ.சி.ஜி.
(ECG) அல்லது ஈ.ஈ.ஜி (EEG)
தரவு போன்ற பயோமெடிக்கல்
டேட்டா (Biomedical data) நீங்கள்
எடுத்துக் கொண்டால்.
ஈ.சி.ஜி. டேட்டா (ECG
Data) தரவு நாம் பார்த்தோ
இல்லையோ, ஆனால் ஈ.சி.ஜி.
(ECG) என்பது எமது ஆராய்ச்சிப்
பணியின் ஒரு பகுதியாக
உள்ளதா இல்லையா என்பதை
நாம் எல்லோரும் பார்க்கிறோம்.

Hindi: 
के आधार पर विसंगतियों
की तलाश में, प्रोजेक्टिंग
रहता है सामान्य
टेम्पलेट पर वर्तमान
डेटा।
और इस तरह हर जगह आम
तौर पर गलती का पता
लगाया जाता है; यहां
तक ​​कि प्रक्रिया
उद्योग में भी स्थिति
है।
इसलिए, इसे प्रक्रिया
निगरानी के रूप में
भी जाना जाता है।
और कई उद्देश्यों
हैं जो डेटा विश्लेषण
(DATA ANALYSIS)में सूचीबद्ध
हो सकते हैं, लेकिन
ये मुख्य रूप से डेटा
विश्लेषण (DATA ANALYSIS)के
अधिकांश अनुप्रयोगों
को कवर करते हैं।
जैसा कि आप देख सकते
हैं कि आवेदन काफी
विविध और विविध है।
इसलिए, हम जिस प्रक्रिया
का विश्लेषण करते
हैं, हम जिन उपकरणों
को तैनात करते हैं,
और जो व्याख्याएं
हम आकर्षित करते
हैं, वे निश्चित रूप
से व्यापक रूप से
भिन्न होते हैं।
इसलिए, डेटा विश्लेषण
(DATA ANALYSIS)को देखने के
लिए उपयोगी है और
डेटा संचालित विश्लेषण
की विस्तृत योजना
में यह कहां फिट है।
तो, यह चित्रकारी
प्रतिनिधित्व यहां
आपको कुछ विचार देने
की कोशिश करता है
कि विश्लेषण कहां
फिट बैठता है।
योजनाबद्ध के शीर्ष
पर, आपके पास प्रक्रिया

Kannada: 
ಇ.ಸಿ.ಜಿ ನೋಡುತ್ತಿರುವ
ಒಬ್ಬ ವೈದ್ಯರು ಆ ಶೃಂಗಗಳಿಗೆ
ಅಗತ್ಯವಾಗಿ ಹುಡುಕುತ್ತಾರೆ
ಮತ್ತು ಆ ಶಿಖರಗಳಲ್ಲಿ
ಅಸಂಗತತೆಗಳನ್ನು ಹುಡುಕುತ್ತಾರೆ,
ಮತ್ತು ಆ ವೈಪರೀತ್ಯಗಳು
ಅನಾರೋಗ್ಯಕರ ಹೃದಯದ
ಸೂಚನೆಯಾಗಿರಬಹುದು.
ಆದ್ದರಿಂದ, ವೈಶಿಷ್ಟ್ಯವನ್ನು
ಹೊರತೆಗೆಯುವಿಕೆ ತುಂಬಾ
ಸಾಮಾನ್ಯವಾಗಿದೆ, ಬಯೋಮೆಡಿಕಲ್ನಲ್ಲಿ
ವರ್ಗೀಕರಣ ಸಹಜ.
ಒಮ್ಮೆ ನಾವು ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು
ಹೊರತೆಗೆಯಲು, ನಾವು
ಚಿತ್ರವನ್ನು ವರ್ಗೀಕರಿಸಲು
ಬಯಸುತ್ತೇವೆ.
ಚಿತ್ರ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ,
ಇದು ತುಂಬಾ ಸಾಮಾನ್ಯ
ವ್ಯಾಯಾಮ.
ನಾವು ಒಂದೇ ರೀತಿಯ
ಬಣ್ಣಗಳು, ಕೂದಲಿನ
ಬಣ್ಣಗಳು, ಕಣ್ಣಿನ
ಬಣ್ಣ ಮತ್ತು ಮುಖದ
ಚರ್ಮದ ಬಣ್ಣ ಮತ್ತು
ಇತರರೊಂದಿಗೆ ವರ್ಗೀಕರಿಸಲು
ಪ್ರಯತ್ನಿಸುತ್ತೇವೆ.
ತದನಂತರ, ಈ ಎಲ್ಲಾ ಕೇಂದ್ರಕ್ಕೆ
ಊಹಾ ಪರೀಕ್ಷೆ.
ಊಹೆಯ ಪರೀಕ್ಷೆ ಎಂದರೇನು?

Marathi: 
परंतु हे मुख्यत्वे
डेटा विश्लेषणाच्या
बहुतेक अर्जांना
व्यापतात.
आपण पाहू शकता म्हणून
अनुप्रयोग बरेच वैविध्यपूर्ण
आणि विभिन्न आहेत.
म्हणूनच, आम्ही एखाद्या
विश्लेषणासाठी ज्या
पद्धती वापरतो, आम्ही
उपयोजित केलेले उपकरणे,
आणि ज्या रेखाचित्रे
आम्ही काढतो त्या
निश्चितपणे वेगवेगळ्या
असतात;
त्यामुळे, डाटा विश्लेषणावर
लक्ष ठेवणे आणि डेटा-आधारित
विश्लेषणाच्या विस्तृत
योजनेमध्ये कोठे
उपयुक्त आहे हे विचारात
घेणे उपयुक्त आहे.
तर, येथे हे चित्रमय
प्रतिनिधीत्व आपल्याला
काही कल्पना देण्याचा
प्रयत्न करते जेथे
विश्लेषण उपयुक्त
ठरते. योजनाबद्धतेच्या
शीर्षस्थानी, आपल्याकडे
प्रक्रिया आहे आणि
ही प्रक्रिया खूप
सामान्य प्रक्रिया
आहे; अभियांत्रिकीची
प्रक्रिया करण्याची
गरज नाही; तो एक सामाजिक
प्रक्रिया किंवा
जैविक प्रक्रिया
असू शकते आणि इत्यादी.
आणि आम्ही सेन्सर्स
प्रक्रियेतील डेटा
गोळा करतो आणि या
सेन्सर्सला फक्त
शास्त्रीय हार्डवेअर
किंवा इन्स्ट्रुमेंटेशन
सेन्सर्स नसावे.
हे मानवी सेंसर देखील
असू शकते. आम्ही सर्वेक्षण

Malayalam: 
എക്സ്-റേ കാണുമ്പോള്‍
ചില മോഡല്‍ അല്ലെങ്കില്‍
സാധാരണ അവസ്ഥയിലുള്ള
ടെംപ്ലേറ്റുകള്‍
അടിസ്ഥാനമാക്കിയുള്ള
ക്രമക്കേടുകള്‍ക്ക്
വേണ്ടി അന്വേഷിക്കുകയാണെങ്കില്‍,
നിലവിലുള്ള ടെംപ്ലേറ്റിന്‍റെ
ഡാറ്റ ശ്രദ്ധയോടെ
വീക്ഷിക്കും.
അങ്ങനെയാണ് എല്ലായിടത്തും
സാധാരണയായി തെറ്റ്
കണ്ടുപിടിക്കല്‍
നടക്കുന്നത് വ്യവസായത്തിലാണെങ്കില്‍പോലും
അതിനാല്‍ ഇത് പ്രോസസ്സ്
മോണിറ്ററിംഗ് എന്നും
അറിയപ്പെടുന്നു.
കൂടാതെ, ഒരു ഡാറ്റ
വിശകലനത്തില്‍ വിശകലനത്തിന്‍റെ
പ്രയോഗങ്ങളില്‍
ഉള്‍പ്പെടുന്നു.
ഇതിന്‍റെ ആപ്ലിക്കേഷന്‍
വളരെ വ്യത്യസ്തവും,
വൈവിദ്ധ്യമാര്‍ന്നതുമാണ്.
അതുകൊണ്ട്, ഒരു വിശകലനത്തിനായി
നമ്മള്‍ പിന്തുടരുന്ന
പ്രക്രിയ, നമ്മള്‍
വിന്യസിക്കുന്ന
ഉപകരണങ്ങളും നമ്മള്‍
അഭിമുഖീകരിക്കുന്ന
വ്യാഖ്യാനങ്ങളും
തീര്‍ച്ചയായും വളരെ
വ്യത്യസ്തമായിരിക്കണം.
അതുപോലെ, ഡാറ്റ വിശകലനം
ചെയ്യുമ്പോള്‍ അതിന്‍റെ
വിശാലമായ പദ്ധതിയനുസരിച്ച്
അത് എവിടെയാണ് അനുയോജ്യമെന്ന്
ചോദിക്കുന്നത് ഉപയോഗപ്രദമാണ്.
അതുകൊണ്ട് ഇവിടെ
ചിത്രീകൃതമായ അവതരണം
വിശകലനം നടത്തുന്നതിനുള്ള
ചില ആശയങ്ങള്‍ നിങ്ങള്‍ക്ക്
നല്‍കും.
ഈ ചിത്രീകരണത്തിന്‍റെ
മുകളില്‍ പ്രോസസ്
ഉണ്ട്.
ഈ പ്രക്രിയ വളരെ
സാധാരണ പ്രക്രിയയാണ്.

Bengali: 
জন্য বেশ কয়েকটি
উদ্দেশ্য আছে।
এটা commomly হতে পারে
.. সাধারণ উদ্দেশ্যে,
উদাহরণস্বরূপ, প্যারামিটার
অনুমান যেখানে আমরা
কিছু অজানা inferring হয়,
এবং যখন আমি এখানে
পরামিতি বলতে, এটি
শুধু মডেল পরামিতি
নয়; এই প্যারামিটারগুলি
পরিসংখ্যানগত বৈশিষ্ট্যগুলিও
উল্লেখ করতে পারে
যা আমরা সাধারণভাবে

Hindi: 
है, और यह प्रक्रिया
एक बहुत ही सामान्य
प्रक्रिया है; इसे
इंजीनियरिंग प्रक्रिया
की आवश्यकता नहीं
है; यह एक सामाजिक
प्रक्रिया या जैविक
प्रक्रिया हो सकती
है और इसी तरह।
और हमारे पास प्रक्रिया
से डेटा एकत्र करने
वाले सेंसर हैं और
इन सेंसर को केवल
शास्त्रीय हार्डवेयर
या वाद्ययंत्र सेंसर
की आवश्यकता नहीं
है।
यह मानव सेंसर भी
हो सकता है।
जब हम सर्वेक्षण
डेटा एकत्र करते
हैं, तो हम वास्तव
में सेंसर हैं।
अंत में, हमारे पास
डेटा है और यही वह
जगह है जहां यात्रा
डेटा विश्लेषण (DATA
ANALYSIS)में शुरू होती
है।
इस मॉड्यूल में, निश्चित
रूप से, हम डेटा एकत्र
करने, नमूनाकरण की
तकनीक आदि के बारे
में बात करने वाले
नहीं हैं; हम डेटा
का विश्लेषण करने
के बारे में अधिक
चिंतित हैं।
इसलिए, मेरे पास डेटा
होने के बाद, आम तौर
पर मैंने इसे कुछ
चरणों के माध्यम
से रखा और हम इसके
बारे में कुछ समय
बाद बात करेंगे।
इस योजनाबद्ध का
उद्देश्य आपको यह
बताने के लिए है कि
विश्लेषण कहां फिट
बैठता है।

Marathi: 
डेटा गोळा करताना,
आम्ही सेंसर आहोत,
खरं तर. सरतेशेवटी,
आमच्याकडे आमच्याकडे
डेटा आहे आणि तो म्हणजे
डेटा विश्लेषणांमध्ये
सुरु होते. या मॉड्यूलमध्ये
नक्कीच माहिती गोळा
करणे, सॅंपलिंगची
तंत्रे आणि इतर गोष्टींबद्दल
आम्ही बोलणार नाही;
आम्हाला डेटाचे विश्लेषण
करण्याबद्दल अधिक
काळजी वाटते.
म्हणून आपल्याकडे
एकदा माझ्याकडे डेटा
आहे, विशेषत: मी काही
विशिष्ट पावले टाकली
आणि थोड्याच वेळात
आपण याबद्दल बोलू.
या योजनेच्या हेतूने
आपल्याला हे सांगणे
हा आहे की विश्लेषण
कोणते आहे. आपण ज्या
विषयावर शीर्षक असलेला
विश्लेषण पहाता ते
दोन अवयव आहेत, हे
मूलत: डेटा विश्लेषणामध्ये
काय चालले आहे याचे
प्रतिनिधित्व आहे.
उदाहरणार्थ, व्हिज्युअलायझेशन
विश्लेषण एक भाग
आहे. आपण काहीतरी
प्लॉट तेव्हा, आणि
डेटा पासून काहीतरी
देखणे प्रयत्न, की
देखील डेटा विश्लेषण
एक भाग आहे. हा एक
फार महत्वाचा भाग
आहे किंवा आपण पॅरामीटर

Gujarati: 
સમર્થન આપવા માટે
થોડોક પ્રયોગાત્મક
કાર્ય સામેલ છે. મોટા
ભાગે, જો તમે આજે જુઓ
છો, તો તે દૃશ્ય ડેટા
એનાલિસિસ(data analysis) વિશે

Kannada: 
ಇದು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಬಹಳ ಸಾಮಾನ್ಯವಾದ ವ್ಯಾಯಾಮವಾಗಿದೆ,
ಅಲ್ಲಿ ಏನಾದರೂ ಸತ್ಯ
ಎಂದು ಸಂಶೋಧಕರು ಹೇಳುತ್ತಾರೆ.
ಉದಾಹರಣೆಗೆ, ಸುತ್ತುವರಿದ
ತಾಪಮಾನದ ಡೇಟಾವನ್ನು
ಸಂಗ್ರಹಿಸೋಣ.
ಅದು ನನ್ನ ಕೋಣೆಯ ಹೊರಗಿದೆ,
ನಾನು ಸಂವೇದಕವನ್ನು
ತೆಗೆದುಕೊಳ್ಳುತ್ತೇನೆ
ಮತ್ತು ಸುಮಾರು ಒಂದು
ಗಂಟೆ ಅಥವಾ ಅದಕ್ಕಿಂತಲೂ
ಹೆಚ್ಚಿನ ತಾಪಮಾನವನ್ನು
ಸಂಗ್ರಹಿಸುತ್ತೇವೆ.
ಮತ್ತು ನಾನು ಹಿಂತಿರುಗಿ
ಬಂದು ಒಂದು ಗಂಟೆಯ
ಸರಾಸರಿ ತಾಪಮಾನವು
25 ಡಿಗ್ರಿ ಸೆಲ್ಷಿಯಸ್
ಎಂದು ಹೇಳಿದೆ.
ಈಗ ಸರಾಸರಿ ತಾಪಮಾನಕ್ಕೆ
ನಾನು ಸೂಚಿಸುವ ಸತ್ಯ
ಇಲ್ಲಿದೆ.
ಮತ್ತು ನಾನು ಸಂಗ್ರಹಿಸಿದ
ಡೇಟಾವನ್ನು ಆಧರಿಸಿ
ನಾನು ಹೊಂದಿದ್ದೇನೆ
ಅಥವಾ ಇಲ್ಲವೇ ಎಂದು
ನಾನು ಮಾಡುವ ವಾದವನ್ನು
ಪರೀಕ್ಷೆಯು ಪರೀಕ್ಷಿಸುತ್ತಿದೆ.

Malayalam: 
അത് ഒരു എഞ്ചിനീയറിംഗ്
പ്രക്രിയ ആകണമെന്നില്ല.
അത് ഒരു സാമൂഹിക
പ്രക്രിയയോ ജൈവ പ്രക്രിയയോ
ആയിരിക്കും.
നമുക്ക് പ്രോസസ്സില്‍
നിന്ന് ഡാറ്റ ശേഖരിക്കുന്ന
സെന്‍സറുകള്‍ ഉണ്ട്.
ഈ സെന്‍സറുകള്‍ക്ക്
ക്ലാസ്സിക്കല്‍
ഹാര്‍ഡ് വെയര്‍ അല്ലെങ്കില്‍
ഇന്‍സ്ട്രുമെന്‍റേഷന്‍
സെന്‍സറുകള്‍ ആകണമെന്നില്ല.
അത് മനുഷ്യ സെന്‍സറുകളുമാകാം.
സര്‍വ്വെ ഡാറ്റ ശേഖരിക്കുമ്പോള്‍
വാസ്തവത്തില്‍ നമ്മള്‍
സെന്‍സറുകളാണ്.
അവസാനമായി നമുക്കുള്ള
ഡേറ്റ ഉപയോഗിച്ചാണ്
ഡാറ്റ വിശകലനത്തിന്‍റെ
യാത്ര ആരംഭിക്കുന്നത്.
ഈ മൊഡ്യൂളില്‍ തീര്‍ച്ചയായും,
നമ്മള്‍ ഡാറ്റ ശേഖരണവും
സാമ്പിള്‍ സമ്പ്രദായങ്ങളും
മറ്റും സംസാരിക്കില്ല.
ഡാറ്റ വിശകലനം ചെയ്യുന്നതില്‍
നമ്മള്‍ കൂടുതല്‍
ശ്രദ്ധിക്കും.
അതിനാല്‍ എനിക്ക്
ഡാറ്റ ഉണ്ടെങ്കില്‍,
സാധാരണയായി ഞാന്‍
ചില ഘട്ടങ്ങളിലൂടെ
കടന്നുപോകും.
കുറച്ച് കഴിഞ്ഞ്
ഞങ്ങള്‍ ഇത് സംസാരിക്കാം.
വിശകലനത്തിന് അനുയോജ്യമായതെന്താണെന്ന്
പറയുകയാണ് ഈ ചിത്രീകരണത്തിന്‍റെ
ലക്ഷ്യം.
നിങ്ങള്‍ ഇവിടെ വിശകലനം
ചെയ്യുന്ന രണ്ട്
ഘട്ടങ്ങളുണ്ട്.

English: 
As you can see the application are quite diverse
and varied. Therefore, the procedure that
we follow for an analysis, the tools that
we deploy, and the interpretations that we
draw have to definitely vary broadly.
So, it’s useful to look at data analysis
and ask where does it fit in, in the broad
scheme of data driven analysis. So, this pictorial
representation here tries to give you some
idea of where analysis fits in. At the top
of the schematic, you have process, and this
process is a very generic process; it need
not be an engineering process; it could be
a social process or a biological process and
so on. And we have sensors collecting data
from the process and these sensors need not
be just the classical hardware or instrumentation
sensors. It could be also human sensors. When
we collect survey data, we are the sensors,

Tamil: 
இது நம் மனித ஆரோக்கியத்துடன்
தொடர்புடையது, மற்றும்
நீங்கள் பார்த்தால்,
ஈ.சி.ஜி.
(ECG) ஒரு ரயில் (Rail) தான்
என்பதை நினைத்தால்,
ஒரு துடிப்பு, பருமனான
பயிர்கள், அதில்
வழக்கமான சிகரங்கள்
உள்ளன, அந்த அம்சங்களைப்
பிரித்தெடுக்க விரும்புகிறோம்.
ஈ.சி.ஜி.
(ECG) யில் இருக்கும்
ஒரு மருத்துவர்,
அந்த சிகரங்களைத்
தேடிக் கண்டுபிடித்து,
அந்த உச்சசிகரங்களில்
முரண்பாடுகளை தேடுகிறார்,
மேலும் அந்த முரண்பாடுகள்
ஒரு ஆரோக்கியமற்ற
இதயத்தை உதாரணமாகக்
காட்டலாம்.

Gujarati: 
છે. ઘણાં બધા ડેટા
એન્જીનિયરિંગ માં
જ ઉત્પન્ન થયા નથી,
પરંતુ દરેક જગ્યાએ
થી મળે છે, અને તેથી,
એક પદ્ધતિસરની રીતે

Tamil: 
எனவே, அம்சம் பிரித்தெடுத்தல்
மிகவும் பொதுவானது,
உயிர் மருத்துவத்தில்
மட்டும் அல்ல, எல்லா
இடங்களிலும்.
மற்றும் வகைப்பாடு.
ஒருமுறை நாம் அம்சங்களைப்
பிரித்தெடுக்கும்போது,
​​படத்தைப் பிரிக்க
விரும்புகிறோம்.
பட ஆய்வுகளில், இது
மிகவும் பொதுவான
பயிற்சி ஆகும்.
நாம் ஒத்த நிறங்கள்,
முடி நிறங்கள், ஒத்த
கண் நிறம், மற்றும்
முக தோல் நிறம் மற்றும்
பலவற்றை வகைப்படுத்த
முயற்சி செய்கிறோம்.
பின்னர், இந்த எல்லாவற்றிற்கும்
மையக்கரு கருதுகோள்
சோதனை ஆகும்.
கருதுகோள் சோதனை
என்றால் என்ன?

Marathi: 
अंदाज लावू शकता
जसे मी चर्चा केली
आहे किंवा आपण मॉडेल
तयार करू शकतो आणि
इत्यादी.
अखेरीस, या डेटा विश्लेषणातून
होणारे परिणाम यापैकी
बरेच व्यापक अनुप्रयोग
आहेत ज्यात मी फक्त
स्पष्ट केले आहे;
तो प्रक्रिया मॉनिटरिंगसाठी
असू शकतो; हे फॉल्ट
डिटेक्शन आहे किंवा
ते प्रोसेस कंट्रोलसाठी
असू शकते, जेथे मी
मोजमापावर आधारित
अभिप्राय कारवाई
करीत आहे. तर, कंट्रोलर
डेटा घेत असतो, काही
प्रकारचे विश्लेषण
करतो, आणि नंतर, इनपुट
कसे हलवावे हे ठरवितात.
डेटा ऍनालिसीस किंवा
ऑप्टिमायझेशनच्या
ऍप्लिकेशनचाही हे
एक भाग आहे, मी प्रक्रियेत
काम करण्याचा एक
ऑप्टिमाइझ केलेला
मार्ग किंवा प्रोजेक्टमध्ये
नवकल्पना किंवा बदल
घडवून आणण्याचा प्रयत्न
करतोय.
मग, काही इतर अनुप्रयोग
आहेत जे मी येथे सूचीबद्ध
केले नाहीत, परंतु
शेवटी तुम्हाला समजले
पाहिजे की डेटा विश्लेषण
हा रस्त्याचा शेवटचा
नाही, परंतु ही डेटा
चालविण्याची प्रक्रिया,
विश्लेषण प्रक्रियेची
एक अत्यंत गंभीर

Bengali: 
আগ্রহী, যেমন গড়
হিসাবে - অর্থ, পরিবর্তন,
বৈকল্পিকতা বা আদর্শ
বিচ্যুতি, মধ্যমা
এবং আরও অনেক কিছু।
সুতরাং, এখানে শব্দ
প্যারামিটার খুব
সাধারণভাবে গ্রহণ
করা উচিত।
মূলত এটি একটি অজানা
যে আমরা ডেটা থেকে
অনুমান করার চেষ্টা
করছি।
স্পষ্টতই, এটি একটি
ডাটা বিশ্লেষণের
সাধারণ ব্যায়াম।

Hindi: 
दो चरण जो आप यहां
शीर्षक विश्लेषण
देखते हैं, यह अनिवार्य
रूप से डेटा विश्लेषण
(DATA ANALYSIS)में क्या चल
रहा है इसका प्रतिनिधित्व
है।
उदाहरण के लिए, विज़ुअलाइजेशन
विश्लेषण का एक हिस्सा
है।
जब आप कुछ साजिश करते
हैं, और डेटा से कुछ
देखने का प्रयास
करते हैं, तो यह डेटा
विश्लेषण (DATA ANALYSIS)का
भी एक हिस्सा है।
यह एक बहुत ही महत्वपूर्ण
हिस्सा है या आप पैरामीटर
अनुमान ले सकते हैं
क्योंकि मैंने अभी
चर्चा की है या आप
मॉडल बना सकते हैं
और इसी तरह।
आखिरकार, इस डेटा
विश्लेषण (DATA ANALYSIS)के
परिणाम इन बहुत व्यापक
अनुप्रयोगों में
से कुछ में जाते हैं
जैसा कि मैंने अभी
समझाया है; यह प्रक्रिया
की निगरानी के लिए
हो सकता है; यह गलती
का पता लगाना है या
यह प्रक्रिया नियंत्रण
के लिए हो सकता है,
जहां मैं माप के आधार
पर प्रतिक्रिया कार्रवाई
कर रहा हूं।
इसलिए, नियंत्रक
डेटा ले रहा है, किसी
प्रकार का विश्लेषण
कर रहा है, और फिर
यह तय कर रहा है कि
इनपुट कैसे चलना
चाहिए।

Kannada: 
ಹಾಗಾಗಿ, ನಾನು ಸಂಗ್ರಹಿಸಿದ
ಮಾಹಿತಿಯು ಪುರಾವೆಯಾಗಿ
ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ
ಮತ್ತು ನನ್ನ ಊಹೆಯನ್ನು
ಬೆಂಬಲಿಸಲು ಡೇಟಾದಲ್ಲಿ
ಸಾಕ್ಷಿಗಾಗಿ ನಾನು
ಹುಡುಕುತ್ತೇನೆ ಮತ್ತು
ಅದನ್ನು ಅಂಕಿಅಂಶಗಳ
ರೀತಿಯಲ್ಲಿ ಉತ್ತಮವಾಗಿ
ಮಾಡಬೇಕಾಗಿದೆ.
ಮತ್ತು ಊಹೆಯ ಪರೀಕ್ಷೆಯು
ಪ್ರತಿ ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ
ಒಳಹರಿವಿನ ವ್ಯಾಯಾಮದ
ಅವಿಭಾಜ್ಯ ಭಾಗವಾಗಿದೆ.
ಇದು ಬಹಳಷ್ಟು ಸಿದ್ಧಾಂತ,
ಸಂಭವನೀಯತೆ ಸಿದ್ಧಾಂತ,
ಅಂದಾಜು ಸಿದ್ಧಾಂತ
ಮತ್ತು ಇನ್ನೂ ಒಳಗೊಂಡಿರುತ್ತದೆ.
ಹೀಗೆ ನಾವು ಊಹಾ ಪರೀಕ್ಷೆಯಲ್ಲಿ
ಆಳವಾಗಿ ಹೋಗುವುದಿಲ್ಲ.
ನಾವು ಊಹಾ ಪರೀಕ್ಷೆಯ
ಪರಿಚಯವನ್ನು ಕಲಿಯುವ
MOOC ಕೋರ್ಸ್ ಇದೆ; ಇದು
ಬಹುಶಃ ಮಾರ್ಚ್ ಎರಡನೇ
ಅಥವಾ ಮೂರನೇ ವಾರದಲ್ಲಿ
ಪ್ರಾರಂಭವಾಗುತ್ತದೆ.
ಮತ್ತು ನೀವು ಆಸಕ್ತಿ
ಇದ್ದರೆ, ನೀವು ಅದರ

Malayalam: 
അതില്‍ വിശകലനം എന്ന
തലക്കെട്ട് കാണാം.
ഉദാഹരണമായി ഭാവനാചിത്രീകരണം,
വിശകലനത്തിന്‍റെ
ഒരു ഭാഗമാണ്.
നിങ്ങള്‍ എന്തെങ്കിലും
ഗ്രാഫ് വരയ്ക്കാന്‍
ശ്രമിക്കുന്നെങ്കില്‍
എന്നിട്ട് ഡാറ്റയില്‍
നിന്ന് എന്തെങ്കിലും
നിരീക്ഷിക്കാന്‍
ശ്രമിക്കുമ്പോള്‍
അത് ഡാറ്റ വിശകലനത്തിന്‍റെ
ഭാഗമാണ്.
ഇത് വളരെ പ്രധാനപ്പെട്ട
ഭാഗമാണ്.
അല്ലെങ്കില്‍ ഞാന്‍
ചര്‍ച്ച ചെയ്തതുപോലെ
നിങ്ങള്‍ക്ക് പരാമീറ്റര്‍
കണക്കാക്കാം.
അല്ലെങ്കില്‍ മോഡലുകളും
മറ്റും നിര്‍മ്മിക്കാം.
ആത്യന്തികമായി, ഈ
ഡാറ്റ വിശകലനത്തില്‍
നിന്നുള്ള ഫലങ്ങള്‍
ഞാന്‍ വിശകലനം ചെയ്തിട്ടുള്ള
ചില വിശാലമായ പ്രയോഗങ്ങളിലേക്ക്
കടക്കുന്നു.
ഇത് പ്രോസസ് നിരീക്ഷണമാകാം.
അത് തെറ്റിനെ കണ്ടെത്തല്‍
അല്ലെങ്കില്‍ പ്രക്രിയ
നിയന്ത്രണം ആകാം.
ഞാന്‍ അളവെടുപ്പിന്‍റെ
അടിസ്ഥാനത്തില്‍
ഫീഡ്ബാക്ക് നടപടി
എടുക്കുന്നു.
അതിനാല്‍, കണ്‍ട്രോളര്‍
ഡാറ്റ കൈക്കൊള്ളുന്നു.
ചില വിശകലനങ്ങള്‍
നടത്തുന്നു.
തുടര്‍ന്ന് ഇന്‍പുട്ട്
എങ്ങനെ നീക്കുന്നു
എന്ന് തീരുമാനിക്കുന്നു.
ഇത് ഡാറ്റ വിശകലനത്തിന്‍റെ
അല്ലെങ്കില്‍ ഒപ്റ്റിമൈസേഷന്‍റെ

English: 
in fact. In the end, we have data with us
and that’s where the journey begins in data
analysis.
In this module, of course, we are not going
to talk about how to collect data, the techniques
of sampling and so on; we are more worried
about analyzing data. So, once I have data,
typically I put it through certain steps and
we will talk about this a bit later. The purpose
of this schematic is to tell you where analysis
fits in. The two stages that you see titled
analysis here, it is essentially the representation
of what goes on in data analysis.
For example, visualization is a part of analysis.
When you plot something, and try to observe
something from the data, that is also a part
of the data analysis. It’s a very important
part or you may carry out parameter estimation
as I just discussed or you may build models
and so on. Ultimately, the results from this
data analysis go into some of these very broad
applications as I just explained; it could

Hindi: 
यह डेटा विश्लेषण
(DATA ANALYSIS)या अनुकूलन
के अनुप्रयोगों का
एक हिस्सा भी है, मैं
प्रक्रिया को चलाने
के एक अनुकूलित तरीके
से आने या प्रक्रिया
में नवाचार या परिवर्तन
करने की कोशिश कर
रहा हूं।
फिर, ज़ाहिर है, कुछ
अन्य अनुप्रयोग हैं
जिन्हें मैंने यहां
सूचीबद्ध नहीं किया
है, लेकिन आखिरकार
आपको समझना चाहिए
कि डेटा विश्लेषण
(DATA ANALYSIS)सड़क का अंत
नहीं है, लेकिन यह
वास्तव में डेटा
संचालित प्रक्रिया,
विश्लेषण प्रक्रिया
की एक बहुत ही महत्वपूर्ण
कला है संचालन और
इतने पर; और जब मैं
यहां प्रक्रिया कहता
हूं, जैसा कि मैंने
पहले उल्लेख किया
था, यह काफी सामान्य
है।
और इस सब में, ज़ाहिर
है, डोमेन ज्ञान बहुत
महत्वपूर्ण है क्योंकि
मैं यहां हाइलाइट
करता हूं, और जब हम
योजनाबद्ध रूप से
वापस आते हैं और डेटा
विश्लेषण (DATA ANALYSIS)में
शामिल व्यवस्थित
प्रक्रिया पर चर्चा
करते हैं, तो हम इसके
बारे में कुछ समय
बाद बात करेंगे।
तो, उम्मीद है कि,
आप समझते हैं कि डेटा
विश्लेषण (DATA ANALYSIS)कहां
फिट बैठता है।
यह वास्तव में अवलोकन
की दुनिया को जानकारी

Kannada: 
ಮೂಲಕ ಕುಳಿತುಕೊಳ್ಳಬೇಕು
ಏಕೆಂದರೆ ಇದು ಪ್ರತಿ
ಅಂಕಿಅಂಶಗಳ ದತ್ತಾಂಶ
ವಿಶ್ಲೇಷಣೆಯ ವ್ಯಾಯಾಮದ
ಅವಿಭಾಜ್ಯ ಅಂಗವಾಗಿದೆ.
ನಂತರ, ನಾವು ದೋಷ ಪತ್ತೆಗೆ
ಬಹುಶಃ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
ನಡೆಸಲಾಗುತ್ತಿದೆ.
ನಾನು ಮೊದಲೇ ವಿವರಿಸಿದಂತೆ
ವೈದ್ಯರು ಇಸಿಜಿಯನ್ನು
ನೋಡುವಾಗ ವೈಪರೀತ್ಯಗಳು
ಅಥವಾ ವಿಕಿರಣಶಾಸ್ತ್ರಜ್ಞ
ಎಕ್ಸ್-ಕಿರಣವನ್ನು
ನೋಡುತ್ತಿರುವಾಗ, ಕೆಲವು
ಮಾದರಿಯ ಅಥವಾ ಸಾಮಾನ್ಯ
ಪರಿಸ್ಥಿತಿಗಳ ಮನಸ್ಸಿನ
ಮನಸ್ಸಿನ ಆಧಾರದ ಮೇಲೆ
ಅಸಂಗತತೆಗಳನ್ನು ಹುಡುಕುತ್ತಿರುವಾಗ,
ಯೋಜನೆಯನ್ನು ಮುಂದುವರೆಸುತ್ತಿದ್ದಾರೆ
ಸಾಮಾನ್ಯ ಟೆಂಪ್ಲೆಟ್ಗೆ
ಪ್ರಸ್ತುತ ಮಾಹಿತಿ.
ಮತ್ತು ಅದು ಸಾಮಾನ್ಯವಾಗಿ
ಎಲ್ಲೆಡೆ ತಪ್ಪು ದೋಷವನ್ನು
ಪತ್ತೆ ಹಚ್ಚುತ್ತದೆ;
ಪ್ರಕ್ರಿಯೆ ಉದ್ಯಮದಲ್ಲಿಯೂ
ಸಹ ಅದು ಪರಿಸ್ಥಿತಿ.
ಆದ್ದರಿಂದ, ಇದು ಪ್ರಕ್ರಿಯೆ
ಮಾನಿಟರಿಂಗ್ ಎಂದೂ
ಕರೆಯಲ್ಪಡುತ್ತದೆ.

Gujarati: 
માહિતીનું એનાલિસિસ(analysis)
કેવી રીતે કરવું
તે સમજવાની જરૂર
છે. ઘણાં બધા સોફ્ટવેર
પેકેજો છે જે વિવિધ
પ્રકારની માહિતીનું

Malayalam: 
പ്രയോഗത്തിന്‍റെ
ഒരു ഭാഗമാണ്.
ഒരു പ്രോസസ് ഓപ്പറേഷന്‍
ചെയ്യുന്നതിനോ അല്ലെങ്കില്‍
ഒപ്റ്റിമൈസേഷന്‍
പ്രക്രിയയിലേക്കോ
മാറ്റങ്ങള്‍ വരുത്താന്‍
ഞാന്‍ പരമാവധി ശ്രമിക്കുന്നു.
പിന്നെ, തീര്‍ച്ചയായും,
ഞാന്‍ ഇവിടെ ലിസ്റ്റ്
ചെയ്തിട്ടില്ലാത്ത
കുറച്ച് ആപ്ലിക്കേഷനുകള്‍
ഉണ്ട്.
പക്ഷേ, ആത്യന്തികമായി
നിങ്ങള്‍ ഡാറ്റ വിശകലനം
റോഡിന്‍റെ അവസാനമല്ലെന്ന്
മനസ്സിലാക്കണം.
പക്ഷേ ഇത് വളരെ വിമര്‍ശനാത്മകമാണ്,
ഡാറ്റ പ്രവര്‍ത്തിപ്പിക്കുന്ന
പ്രോസസ്, വിശകലനപ്രക്രിയ
പ്രവര്‍ത്തനങ്ങള്‍
തുടങ്ങിയവ; ഞാന്‍
നേരത്തെ പറഞ്ഞത്
പോലെ, ആ പ്രക്രിയകള്‍
പൊതുവായതാണ്.
എല്ലാ കാര്യങ്ങളിലും,
തീര്‍ച്ചയായും, ഡൊമെയ്ന്‍
അറിവ് വളരെ പ്രധാനമാണ്
ഇവിടെ ഞാന്‍ അത്
ഹൈലൈറ്റ് ചെയ്തിരിക്കുന്നു.
ഞങ്ങള്‍ ഈ വിഷയത്തെക്കുറിച്ച്
പിന്നെ വിശദീകരിക്കും.
നമ്മള്‍ വിശകലനത്തിലേക്ക്
മടങ്ങുകയും ഡാറ്റ
വിശകലനത്തില്‍ ഉള്‍പ്പെട്ടിരിക്കുന്ന
വ്യവസ്ഥാപിതമായ
പ്രക്രിയയെക്കുറിച്ച്
ചര്‍ച്ച ചെയ്യുകയും
ചെയ്യാം.
അതിനാല്‍, ഡാറ്റ
വിശകലനം അതില്‍ എവിടെ
അനുയോജ്യമാണെന്ന്
നിങ്ങള്‍ മനസ്സിലാക്കണം.

Marathi: 
कला आहे ऑपरेशन आणि
याप्रमाणे; आणि मी
येथे प्रक्रिया बोलतो
तेव्हा, मी आधी नमूद
केल्याप्रमाणे, त्याचे
सामान्यपणे सामान्य.
आणि या सर्व गोष्टींमध्ये,
अर्थातच, डोमेन ज्ञान
अतिशय महत्वाचे आहे
कारण मी येथे हायलाइट
करते, आणि आम्ही थोडक्यात
नंतर याबद्दल चर्चा
करतो जेव्हा आपण
योजनेत परत येतो
आणि डेटा विश्लेषणात
समाविष्ट असलेल्या
पद्धतशीर पद्धतींची
चर्चा करतो. त्यामुळे,
आशेने, आपण जेथे डेटा
विश्लेषण फिट केला
आहे हे समजून घेता.
प्रत्यक्षात माहितीच्या
विश्वाकडे निरीक्षणास
जग जोडते.
आपल्या विश्लेषणाच्या
आवश्यकतेनुसार आणि
अंताच्या वापरावर
आधारित, आता बर्याच
प्रकारचे विश्लेषण
स्पष्टपणे दिसून
आले आहे आणि साहित्य
आपल्याला शोधू शकतील
असे अनेक वर्गीकरण
आहेत. मी येथे जे काही
सूचीबद्ध केले आहे
ते काहीही नाही. आपण
पाहत असलेले विश्लेषण
सामान्य वर्गीकरणांपैकी
एक म्हणजे अन्वेषणसूचक
श्लोक आहेत. अन्वेषण
प्रकारातील विश्लेषणात,
आपण काहीही अग्रहक्क

Bengali: 
তারপর, অবশ্যই, আমরা
সর্বব্যাপী মডেল
উন্নয়ন আছে।
আমাদের মধ্যে অনেকে
দুই বা তার বেশি ভেরিয়েবলের
মধ্যে মডেলগুলির
ডেভেলপ করার ডেটা
সংগ্রহ করে।
এবং কেন আমরা মডেল
বিকাশ?
মূলত আগ্রহের পরিবর্তনশীলতার
পূর্বাভাসের জন্য।
পূর্বাভাসের জন্য
টেকনিক্যাল শব্দটিও
অর্থনীতিবিদ ও সামাজিক
বিজ্ঞানের ভবিষ্যদ্বাণী

English: 
be for process monitoring; that is fault detection
or it could be for process control, where
I am taking feedback action based on measurements.
So, the controller is taking in the data,
performing some kind of analysis, and then,
deciding how the input should move. That’s
also a part of the applications of the data
analysis or optimization, I am trying to come
up with an optimized way of operating a process,
or making innovations or changes to the process.
Then, of course, there are few other applications
that I have not listed here, but ultimately
you should understand that data analysis is
not the end of the road, but it is really
a very, very critical art of data driven process,
analysis process operations and so on; and
when I say process here, as I mentioned earlier,
its fairly general. And in all of this, of
course, the domain knowledge is very, very
important as I highlight here, and we will

Tamil: 
இது டேட்டா அனாலிசிஸ்
(Data Analysis)ல் மிகவும்
பொதுவான பயிற்சி
ஆகும், அங்கு ஆராய்ச்சியாளர்
நிச்சயம் ஏதாவது
இருப்பது போன்று
இருக்கிறது.
உதாரணமாக, நான் சூழ்நிலை
வெப்பநிலை தரவு சேகரிக்க
வேண்டும் என்று நினைக்கிறேன்.
அது என் அறைக்கு
வெளியில் இருக்கிறது,
நான் ஒரு சென்சார்
(sensor) எடுத்து சுற்றி
ஒரு மணி நேரம் அல்லது
இருக்கலாம் பற்றி
அம்பியண்ட் (ambient) சேகரிக்க.
நான் மீண்டும் வந்து
ஒரு மணி நேரத்தில்

Kannada: 
ಮತ್ತು ದತ್ತಾಂಶ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಒಂದು ಪಟ್ಟಿ ಮಾಡಬಹುದಾದ
ಅನೇಕ ಉದ್ದೇಶಗಳಿವೆ,
ಆದರೆ ಅವುಗಳು ಮುಖ್ಯವಾಗಿ
ದತ್ತಾಂಶ ವಿಶ್ಲೇಷಣೆಯ
ಹೆಚ್ಚಿನ ಅನ್ವಯಗಳನ್ನು
ಒಳಗೊಂಡಿವೆ.
ನೀವು ನೋಡುವಂತೆ ಅಪ್ಲಿಕೇಶನ್
ತುಂಬಾ ವೈವಿಧ್ಯಮಯವಾಗಿದೆ.
ಆದ್ದರಿಂದ, ನಾವು ವಿಶ್ಲೇಷಣೆಗೆ
ಅನುಸರಿಸುವ ವಿಧಾನ,
ನಾವು ನಿಯೋಜಿಸುವ ಸಾಧನಗಳು
ಮತ್ತು ನಾವು ಸೆಳೆಯುವ
ವ್ಯಾಖ್ಯಾನಗಳು ಖಂಡಿತವಾಗಿಯೂ
ವ್ಯಾಪಕವಾಗಿ ವ್ಯತ್ಯಾಸಗೊಳ್ಳಬೇಕು.
ಆದ್ದರಿಂದ, ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ
ವಿಶಾಲವಾದ ಯೋಜನೆಯಲ್ಲಿ,
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯನ್ನು
ನೋಡಲು ಮತ್ತು ಅದನ್ನು
ಎಲ್ಲಿ ಹೊಂದಿಕೊಳ್ಳಬೇಕು
ಎಂದು ಕೇಳಲು ಇದು ಉಪಯುಕ್ತವಾಗಿದೆ.
ಈ ಚಿತ್ರಾತ್ಮಕ ಪ್ರಾತಿನಿಧ್ಯವು
ವಿಶ್ಲೇಷಣೆಗೆ ಸರಿಹೊಂದುವ
ಸ್ಥಳದ ಕಲ್ಪನೆಯನ್ನು
ನಿಮಗೆ ನೀಡಲು ಪ್ರಯತ್ನಿಸುತ್ತದೆ.
ರೂಪರೇಖೆಯ ಮೇಲ್ಭಾಗದಲ್ಲಿ,
ನೀವು ಪ್ರಕ್ರಿಯೆಯನ್ನು

Gujarati: 
એનાલિસિસ(analysis) કરી
શકે છે. અને એ યાદ
રાખવું જોઈએ કે ડેટા
એનાલિસિસ(data analysis) માત્ર
સોફ્ટવેર પેકેજોમાં
માહિતી ફેંકવાની

Tamil: 
சராசரி வெப்பநிலை
25 டிகிரிசி (degree C) என்று
முன்வைக்க.
இப்போது அந்த சராசரி
வெப்பநிலையை நான்
முன்வைக்கிறேன்.
மற்றும் கருதுகோள்
சோதனை என்பது நான்
சேகரித்த டேட்டா
(Data) அடிப்படையாகக்
கொண்டிருக்கிறதா
அல்லது இல்லையா என்பதை
நான் செய்கிறேன்.
எனவே, நான் சேகரித்த
டேட்டா (Data) ஒரு ஆதாரமாகவும்,
என் கருதுகோளை ஆதரிப்பதற்காக
டேட்டா (Data)களில் ஆதாரங்களைத்
தேடிக் கண்டுபிடிக்கும்,
மேலும் இது புள்ளிவிவர
ரீதியாக ஒலி முறையில்
செய்யப்பட வேண்டும்.
மற்றும் கருதுகோள்
சோதனை என்பது ஒவ்வொரு

Bengali: 
করা হয়; এটি একটি
খুব সাধারণ শব্দ
এবং এটি নিজের একটি
বিশাল ক্ষেত্র।
এবং তারপর, আমরা বৈশিষ্ট্য
নিষ্কাশন আছে।
সুতরাং, উদাহরণস্বরূপ,
যদি আপনি ইওসিজি
বা ইইজি তথ্য যেমন
বায়োমেডিকাল ডাটা
গ্রহণ করেন ইসিজি
তথ্যগুলিতে আমরা
দেখেছি বা না, তবে
ইসিজি এমন কিছু বিষয়

Marathi: 
ठेवू नका, परंतु आपण
फक्त डेटा शोधत आहात
आणि आपली प्रक्रिया
समजण्याचा प्रयत्न
करीत आहात. उदाहरणार्थ,
हा अर्थ किंवा मानक
विचलन किंवा ग्राफ
पाहत आहे, हे समजण्यासाठी
प्रयत्न करीत आहे
की प्रक्रिया ही
लीनियर किंवा स्टेशनरी
आहे आणि अशीच आहे;
प्रक्रिया ओसीलायलेटर
आहे की नाही हे अनुमान
काढण्याचा प्रयत्न
करीत आहे. येथे भरपूर
दृश्यमान आहे आणि
काही वर्णनात्मक
संख्याशास्त्रीय
विश्लेषण त्यात समाविष्ट
आहे; तर पुष्टीपूर्ण
विश्लेषण मध्ये,
आपल्याकडे एक आचरणात
अग्रहक्क आहे आणि
आपण आपल्या मनात
काय आहे ते निश्चित
आहे किंवा नाही हे
पुष्टी करण्यासाठी
डेटा वापरेल.
तर, हे उघड आहे की
तेथे थोडा फरक आहे.
आणि मग, आपल्याकडे
गुणात्मक डेटा विश्लेषणाची
मात्रात्मक अध्याय
आहेत. गुणात्मक डेटा
विश्लेषणात, उदाहरणार्थ,
आपण ट्रेंड पाहू
शकता; आपण विशिष्ट
वैशिष्ट्ये आणि ओसिलेटोरी
(oscillatory) वैशिष्ट्ये
शोधत आहात, उदाहरणार्थ.
ज्या तऱ्हेच्या प्रमाणात
आपण जात आहात ... आपण

Hindi: 
की दुनिया से जोड़ता
है।
कई अलग-अलग प्रकार
के विश्लेषण हैं,
जाहिर है, अब, आपके
विश्लेषण की आवश्यकता
और अंतिम उपयोग के
आधार पर, और साहित्य
में आप कई वर्गीकरण
प्राप्त कर सकते
हैं।
जो मैंने यहां सूचीबद्ध
किया है वह किसी भी
तरह से संपूर्ण नहीं
है।
विश्लेषण के सामान्य
वर्गीकरणों में से
एक जो आप देखते हैं
वह अन्वेषक छंद है।
एक अन्वेषक प्रकार
के विश्लेषण में,
आप कुछ भी आगे नहीं
पोस्ट करते हैं, लेकिन
आप केवल डेटा की खोज
कर रहे हैं और अपनी
प्रक्रिया को समझने
की कोशिश कर रहे हैं।
उदाहरण के लिए, यह
अर्थ या मानक विचलन
को देख सकता है या
ग्राफ को देख सकता
है, यह समझने की कोशिश
कर रहा है कि प्रक्रिया
रैखिक या स्टेशनरी
है या नहीं; यह अनुमान
लगाने की कोशिश कर
रहा है कि प्रक्रिया
ओसीलेटर है या नहीं।
बहुत सारे दृश्य
हैं और कुछ वर्णनात्मक
सांख्यिकीय विश्लेषण
शामिल है; जबकि पुष्टिकरण
विश्लेषण में, आपके
पास एक पहले से पोस्टलेट
अपफ्रंट है, और आप
डेटा का उपयोग इस

Malayalam: 
ഇത് തീര്‍ച്ചയായും
ലോകവിവരങ്ങള്‍ ലോകത്തിലെ
നിരീക്ഷണങ്ങളുമായി
ബന്ധിപ്പിക്കുന്നു.
നിങ്ങളുടെ വിശകലനത്തിന്‍റെ
ആവശ്യവും അന്തിമ
ഉപയോഗവും അനുസരിച്ച്
ഇപ്പോള്‍ പല തരത്തിലുള്ള
വിശകലനങ്ങള്‍ ഉണ്ട്.
സാഹിത്യത്തില്‍
നിങ്ങള്‍ക്ക് കണ്ടെത്താന്‍
കഴിയുന്ന നിരവധി
വര്‍ഗീകരണങ്ങള്‍
ഉണ്ട്.
ഞാന്‍ ഇവിടെ ലിസ്റ്റ്
ചെയ്തിരിക്കുന്നത്
ഒരു ആശയമല്ല.
നിങ്ങള്‍ കാണുന്ന
വിശകലനത്തിന്‍റെ
പൊതു വര്‍ഗ്ഗീകരണങ്ങളില്‍
ഒന്നാണ് പര്യവേക്ഷണ
വാക്യങ്ങള്‍ സ്ഥിരീകരിക്കുക.
ഒരു പര്യവേക്ഷണതരം
വിശകലനത്തില്‍, നിങ്ങള്‍
മുന്‍കൂര്‍ ഒന്നും
മുന്നോട്ടുകൊണ്ടുപോവുകയില്ല.
എന്നാല്‍ ഡാറ്റ പര്യവേക്ഷണത്തില്‍
നിങ്ങള്‍ ഒന്നും
അനുമാനിക്കാതെ നിങ്ങളുടെ
പ്രക്രിയ തെരഞ്ഞെടുത്ത്
അത് മനസ്സിലാക്കാന്‍
ശ്രമിക്കുകയും ചെയ്യുന്നു.
ഉദാഹരണത്തിന്, അത്
ശരാശരി അല്ലെങ്കില്‍
സ്റ്റാന്‍ഡേര്‍ഡ്
ഡീവിയേഷന്‍ നോക്കുകയോ
ഗ്രാഫുകള്‍ നോക്കുകയോ
ആകാം. അങ്ങനെ പ്രോസസ്സ്
നേര്‍രേഖയിലോ അല്ലെങ്കില്‍
സ്ഥിരമായതോ മറ്റോ
എന്ന് മനസ്സിലാക്കാന്‍
ശ്രമിക്കാം; പ്രക്രിയ
വളരെ മന്ദീഭവിക്കുന്നുണ്ടോ
എന്ന് അനുമാനിക്കാന്‍
ശ്രമിക്കുന്നു.
അവിടെ ധാരാളം വീക്ഷണങ്ങളും
ചില വിവരണാത്മക സ്റ്റാറ്റിസ്റ്റിക്കല്‍

English: 
talk about this a bit later when we return
to the schematic and discuss the systematic
procedure that’s involved in data analysis.
So, hopefully, you understand where data analysis
fits in. It actually connects the world of
observations to the world of information.
There are many different types of analysis,
obviously, now, depending on the need and
the end use of your analysis, and there are
several classifications that you can find
in the literature. What I listed here is by
no means exhaustive.
One of the common classifications of analysis
that you see is exploratory verses confirmatory.
In an exploratory type of analysis, you do
not postulate anything upfront, but you are
just exploring the data and trying to understand
your process. For example, it could be looking
at the mean or the standard deviation or looking
at the graphs, trying to understand whether
the process is linear or stationery and so
on; trying to infer whether the process is

Bengali: 
যা আমরা দেখতে পাই
যে এটি আমাদের গবেষণা
কাজের অংশ নয় বা
না।
এটি আমাদের মানব
স্বাস্থ্যের সাথে
সম্পর্কিত, এবং যদি
আপনি দেখেন, যদি আপনি
ইসিজি মনে করেন একটি
ট্রেন, এটি একটি পালস,
ডালের ট্রেন যা এতে
নিয়মিত পিক্স থাকে

Malayalam: 
വിശകലനങ്ങളും ഉള്‍പ്പെടുന്നു.
സ്ഥിരീകരണവിശകലനത്തില്‍,
നിങ്ങള്‍ക്ക് ഒരു
അനുമാനം മുന്‍കൂര്‍
ഉണ്ടായിരിക്കും.
നിങ്ങളുടെ മനസ്സിലുള്ളത്
ശരിയാണോ എന്ന് ഉറപ്പുവരുത്തുന്നതിന്
നിങ്ങള്‍ ഡാറ്റ ഉപയോഗിക്കും.
അതിനാല്‍ തീര്‍ച്ചയായും
അവിടെ അല്പം വൈരുദ്ധ്യമുണ്ട്.
തുടര്‍ന്ന്, നിങ്ങള്‍ക്ക്
ഗുണപരമായും ഡാറ്റ
വിശകലനം ഉണ്ട്.
ഉദാഹരണത്തിന്, ഗുണപരമായ
ഡാറ്റ വിശകലനത്തില്‍
നിങ്ങള്‍ ട്രെന്‍ഡുകള്‍
നോക്കുന്നു.
ചില സവിശേഷതകളും
നിങ്ങള്‍ തിരയുന്നു.
എന്നാല്‍ നിങ്ങളുടെ
അളവുപരമായ വിശകലനത്തില്‍
നിന്ന് നിങ്ങള്‍ക്ക്
സംഖ്യാപരമായ ഫലങ്ങള്‍
കാണാം.
അതിന് ശേഷം താങ്കള്‍ക്ക്
വിവരണപരമായും അനുമാനപരമായും
വിശകലനങ്ങളുണ്ട്.
വിവരണപരമായ വിശകലനത്തില്‍,
വീണ്ടും, അത് കുറഞ്ഞതോ
കൂടിയതോ ആയ പരിശോധനയാകാം
അനുമാന വിശകലനങ്ങളില്‍
നിങ്ങള്‍ ഡാറ്റയില്‍
നിന്ന് നിര്‍ദ്ദിഷ്ടമായി
എന്തെങ്കിലും പറയാന്‍
ശ്രമിക്കുന്നു.
നിങ്ങള്‍ അതിനെ ഹൈപ്പോടെസിസ്
പരിശോധനയ്ക്ക് വിധേയമാക്കുന്നു.
അതുകൊണ്ട്, അനേകം
ചിട്ടയായ സംഖ്യാപരമായ
സ്റ്റാസ്റ്റിക്കല്‍
വിശകലനങ്ങള്‍ അനുമാനിക
വിശകലനങ്ങളില്‍
ഉള്‍പ്പെടുന്നു.

Kannada: 
ಹೊಂದಿದ್ದೀರಿ, ಮತ್ತು
ಈ ಪ್ರಕ್ರಿಯೆಯು ಬಹಳ
ಸಾಮಾನ್ಯ ಪ್ರಕ್ರಿಯೆಯಾಗಿದೆ;
ಇದು ಎಂಜಿನಿಯರಿಂಗ್
ಪ್ರಕ್ರಿಯೆಯಾಗಿರಬೇಕಾಗಿಲ್ಲ;
ಅದು ಒಂದು ಸಾಮಾಜಿಕ
ಪ್ರಕ್ರಿಯೆ ಅಥವಾ ಜೈವಿಕ
ಪ್ರಕ್ರಿಯೆಯಾಗಿರಬಹುದು.
ಮತ್ತು ನಾವು ಪ್ರಕ್ರಿಯೆಯಿಂದ
ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುವ
ಸಂವೇದಕಗಳನ್ನು ಹೊಂದಿದ್ದೇವೆ
ಮತ್ತು ಈ ಸಂವೇದಕಗಳು
ಕೇವಲ ಶಾಸ್ತ್ರೀಯ ಯಂತ್ರಾಂಶ
ಅಥವಾ ಸಲಕರಣೆ ಸಂವೇದಕಗಳಾಗಿರಬೇಕಾಗಿಲ್ಲ.
ಇದು ಮಾನವ ಸಂವೇದಕಗಳಾಗಬಹುದು.
ನಾವು ಸಮೀಕ್ಷೆಯ ಡೇಟಾ
ಸಂಗ್ರಹಿಸಿದಾಗ, ನಾವು
ಸಂವೇದಕಗಳಾಗಿದ್ದೇವೆ.
ಕೊನೆಯಲ್ಲಿ, ನಾವು
ನಮ್ಮೊಂದಿಗೆ ಡೇಟಾವನ್ನು
ಹೊಂದಿದ್ದೇವೆ ಮತ್ತು
ಅದು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಪ್ರಯಾಣವು ಪ್ರಾರಂಭವಾಗುವ
ಸ್ಥಳವಾಗಿದೆ.
ಈ ಮಾಡ್ಯೂಲ್ನಲ್ಲಿ,
ನಾವು ಡೇಟಾವನ್ನು ಹೇಗೆ
ಸಂಗ್ರಹಿಸುವುದು ಎಂಬುದರ
ಬಗ್ಗೆ ಮಾತನಾಡಲು ಹೋಗುತ್ತಿಲ್ಲ,

English: 
oscillatory. There is a lot of visual plus
some descriptive statistical analysis is involved;
whereas in confirmatory analysis, you have
a postulate upfront, and you would use the
data to confirm whether what you have in mind
is correct or not. So, obviously, there is
a bit of contrast there.
And then, you have quantitative verses qualitative
data analysis. In qualitative data analysis,
for example, you look at trends; you are searching
for certain features and oscillatory features,
for example. Whereas, in quantitative you
are being… you are looking at numerical
results from your analysis.
Then, you have something called descriptive
verses inferential. And in descriptive analysis,
again, it is more or less like exploratory;
whereas in inferential you are trying to infer
something very specific from data and you
are subjecting it to hypothesis testing. So,
there is a lot of systematic, numerical, and
statistical analysis involved in inferential

Hindi: 
बात की पुष्टि करने
के लिए करेंगे कि
आपके मन में क्या
सही है या नहीं।
तो, जाहिर है, वहाँ
थोड़ा विपरीत है।
और फिर, आपके पास मात्रात्मक
छंद गुणात्मक डेटा
विश्लेषण (DATA ANALYSIS)है।
गुणात्मक डेटा विश्लेषण
(DATA ANALYSIS)में, उदाहरण
के लिए, आप रुझानों
को देखते हैं; आप उदाहरण
के लिए कुछ विशिष्ट
विशेषताओं और दोलन
सुविधाओं की खोज
कर रहे हैं।
जबकि, मात्रात्मक
में आप ... आप अपने विश्लेषण
से संख्यात्मक परिणाम
देख रहे हैं।
फिर, आपके पास वर्णनात्मक
छंद नामक कुछ है।
और वर्णनात्मक विश्लेषण
में, फिर से, यह कमोबेश
खोजपूर्ण की तरह
है; हीनता में रहते
हुए आप डेटा से बहुत
विशिष्ट चीज़ों का
अनुमान लगाने की
कोशिश कर रहे हैं
और आप इसे परिकल्पना
परीक्षण के अधीन
कर रहे हैं।
तो, बहुत से व्यवस्थित,
संख्यात्मक और सांख्यिकीय
विश्लेषण शामिल हैं
जो हीनतापूर्ण विश्लेषण
में शामिल हैं, और
यह एक बड़े विश्लेषण
का एक हिस्सा हो सकता
है जो आप ऐसा कर रहे
हैं जैसे कि एक मॉडल
और इतने पर निर्माण।
जबकि, वर्णनात्मक
विश्लेषण जरूरी नहीं

Gujarati: 
નથી, અને તે પછી, કેટલાક
અદભુત ગ્રાફ કે જે
પેદા થાય છે અને કેટલાક
સરસ પરિણામો જે તમે
તમારા કમ્પ્યુટર
સ્ક્રીન પર મેળવો

Marathi: 
आपल्या विश्लेषणातून
संख्यात्मक परिणाम
पहात आहात. मग, आपण
वर्णनात्मक श्लोक
स्पष्ट करण्यासाठी
काहीतरी म्हटले आहे.
आणि वर्णनात्मक विश्लेषण
मध्ये, पुन्हा, तो
शोधक म्हणून अधिक
किंवा कमी आहे; तर
स्पष्टपणे आपण डेटापेक्षा
खूप विशिष्ट काहीतरी
अनुमान काढण्याचा
प्रयत्न करीत आहात
आणि आपण ते परीणाम
चाचणीवर अधीन आहात.
तर, बर्याच पद्धतशीर,
अंकीय आणि आकडेवारीचे
विश्लेषणात्मक विश्लेषण
केले गेले आहे आणि
हे असे एक मोठे विश्लेषण
करण्याचा एक भाग
असू शकते की आपण असे
मॉडेल तयार करणे
आणि असे करणे. तर,
वर्णनात्मक विश्लेषण
थेट मोठ्या विश्लेषणात
पोसणार नाही; विशेषत:
डेटा विश्लेषणातील
प्रथम चरण आहे. मग,
तुमच्या श्लोकानुसार
भविष्यसूचक श्लोक
आहेत पूर्वानुमानानुसार
विश्लेषण डेटावर
आधारित कोठे आहे
हे विचारात आहे. आणि
हे बर्याच अनुप्रयोगांमध्ये
उपयुक्त आहे; तर आज्ञाधारक
म्हणजे काही का घडले
आहे याबद्दल विचारणा
करणे आहे. तर, आपण
एकतर डॉक्टर म्हणून

Tamil: 
புள்ளிவிவர பயிற்சிகளுக்கான
ஒரு ஒருங்கிணைந்த
பகுதியாகும்.
இது நிச்சயமாக கோட்பாடு,
நிகழ்தகவு கோட்பாடு,
மதிப்பீட்டு கோட்பாடு
மற்றும் பலவற்றை
உள்ளடக்கியது.
நாம் கருதுகோள் சோதனை
ஆழமாக செல்ல மாட்டோம்.
கருதுகோள் சோதனை
அறிமுகத்தில் நாம்
கற்றுக் கொள்ளும்
மூக் (MOOC) நிச்சயமாக
உள்ளது; இது மார்ச்
(March) இரண்டாவது அல்லது
மூன்றாவது வாரத்தில்
தொடங்கும்.
நீங்கள் ஆர்வமாக
இருந்தால், ஒவ்வொரு
ஸ்டாடிஸ்டிக்கல்
டேட்டா (statistical analysis)
பகுப்பாய்வு ஒரு
ஒருங்கிணைந்த பகுதியாக

Tamil: 
உள்ளது, ஏனெனில்
நீங்கள் அதை அமர்த்த
வேண்டும்.
பின்னர், தவறான கண்டறிதலுக்கு
அனேகமாக டேட்டா அனாலிசிஸ்
(Data Analysis) செய்யப்படுகிறது.
நான் முன்னர் விளக்கியபடி,
மருத்துவர், ஈ.சி.ஜி.
(ECG)யில் இருக்கும்போது,
​​முரண்பாடுகளைத்
தேடுகிறார் அல்லது
ஒரு கதிர்வீச்சாளர்
எக்ஸ்-கதிரைக் (X-Ray)
கவனித்து பார்க்கையில்,
சில மாதிரியை அடிப்படையாகக்
கொண்ட முரண்பாடுகளை
அல்லது சாதாரண நிலைமைகளின்
அடிப்படையில், சாதாரண
டெம்ப்ளேட்டின்
(template) தற்போதைய தரவு.
மற்றும் பொதுவாக
தவறான கண்டறிதல்
எல்லா இடங்களிலும்
எப்படி நடத்தப்படுகிறது;
நிலைமை இன்று தொழில்
துறையில் கூட உள்ளது.

Marathi: 
किंवा इंजिनीअर म्हणून
किंवा इकॉनॉमिस्ट
प्रमाणे डेटाकडे
पाहिला आहे आणि आपण
बाजारातील डेटा बघितले
आणि अचानक क्रॅश
झाली आहे आणि आपण
योग्य विचारत आहात
- ही दुर्घटना का झाली
किंवा का झाली?
एखाद्या विशिष्ट
गुन्ह्यामध्ये प्रक्रियेत
असे होते आणि इत्यादी.
आणि मग, आपण हे कसे
टाळावे याचे सूचवित
आहात, नक्कीच.
म्हणूनच, निबंधात्मक
विश्लेषणात निदान
आणि उपचारात्मक वस्तू
असणार आहे. तर, जाहीरपणे,
विविध प्रकारचे विश्लेषण
पूर्ण केले गेले
आहे आणि बरेच इतर
वर्गीकरण जे मी सूचीबद्ध
केले नाहीत.
थोडक्यात, चांगले
प्रारंभिक गुण शोध
आणि वर्णनात्मक विश्लेषण
आहेत आणि त्यानंतर
तेथून एक रक्कम; जरी
आपण असे ठरविले असेल
की आपण अंदाजानुसार
एखादे मॉडेल तयार
करणार आहात आणि असे
असेल तर, आपण डेटा
एक्सप्लोर करणे,
डेटासह मित्र बनविण्याची
शिफारस करणे आणि
आपण डेटासह स्वतःची
ओळख करून घ्यावी,
आपण एक मॉडेल विकसित

English: 
analysis, and this could be a part of a larger
analysis that you are doing such as building
a model and so on. Whereas, descriptive analysis
is not necessarily going to feed directly
into a larger analysis; it’s typically the
first step in data analysis.
Then, you have predictive verses prescriptive.
Predictive analysis is about asking where
the process is heading based on data. And
this is very useful in many, many applications;
whereas prescriptive is about asking why something
has happened. So, you have looked at the data
either as a doctor or as an engineer or even
as an econometrist and you looked at market
data, and suddenly there has been a crash,
and you are asking well – why did this crash
occur or why did a particular fault occur
in a process and so on. And then, you are,
of course, going to suggest as to how to prevent
this. So, there is going to be a diagnosis
and remedial thing involved in prescriptive
analysis. So, obviously, there is a whole

Hindi: 
है कि सीधे बड़े विश्लेषण
में फीड किया जाए;
यह आमतौर पर डेटा
विश्लेषण (DATA ANALYSIS)में
पहला कदम है।
फिर, आपके पास भविष्य
कहनेवाला छंद है।
भविष्य कहनेवाला
विश्लेषण यह पूछने
के बारे में है कि
डेटा के आधार पर प्रक्रिया
कहां चल रही है।
और यह कई, कई अनुप्रयोगों
में बहुत उपयोगी
है; जबकि प्रिस्क्रिप्टिव
यह पूछने के बारे
में है कि कुछ क्यों
हुआ है।
तो, आपने डेटा को एक
डॉक्टर के रूप में
या एक इंजीनियर के
रूप में या एक अर्थशास्त्री
के रूप में भी देखा
है और आपने बाज़ार
के आंकड़ों को देखा
है, और अचानक एक दुर्घटना
हुई है, और आप अच्छी
तरह से पूछ रहे हैं
- यह दुर्घटना क्यों
हुई या क्यों हुई
एक विशेष गलती एक
प्रक्रिया में होती
है और इसी तरह।
और फिर, आप निश्चित
रूप से सुझाव दे रहे
हैं कि इसे कैसे रोका
जाए।
तो, वहाँ एक होने जा
रहा है
निदान और उपचारात्मक
विश्लेषण में उपचारात्मक
बात शामिल है।
तो, जाहिर है, विभिन्न
प्रकार के विश्लेषणों
की एक पूरी मेजबानी
है जो इसमें शामिल

Kannada: 
ಮಾದರಿಗಳ ತಂತ್ರಗಳು
ಮತ್ತು ಹೀಗೆ; ಡೇಟಾವನ್ನು
ವಿಶ್ಲೇಷಿಸುವ ಬಗ್ಗೆ
ನಾವು ಹೆಚ್ಚು ಚಿಂತಿತರಾಗಿದ್ದೇವೆ.
ಆದ್ದರಿಂದ, ಒಮ್ಮೆ
ನಾನು ಡೇಟಾವನ್ನು ಹೊಂದಿದ್ದೇನೆ,
ಸಾಮಾನ್ಯವಾಗಿ ನಾನು
ಕೆಲವು ಹಂತಗಳ ಮೂಲಕ
ಅದನ್ನು ಹಾಕಿದ್ದೇನೆ
ಮತ್ತು ಸ್ವಲ್ಪ ಸಮಯದ
ನಂತರ ನಾವು ಅದರ ಕುರಿತು
ಮಾತನಾಡುತ್ತೇವೆ.
ವಿಶ್ಲೇಷಣೆಯು ಸೂಕ್ತವಾದ
ಸ್ಥಳದಲ್ಲಿ ನಿಮಗೆ
ತಿಳಿಸುವುದು ಈ ಸ್ಕೀಮ್ಯಾಟಿಕ್
ಉದ್ದೇಶವಾಗಿದೆ.
ಇಲ್ಲಿ ನೀವು ವಿಶ್ಲೇಷಣೆಗೆ
ಹೆಸರಿಸಿರುವ ಎರಡು
ಹಂತಗಳನ್ನು ನೋಡಿದರೆ,
ಅದು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಏನು ನಡೆಯುತ್ತಿದೆ
ಎಂಬುದರ ಪ್ರಾತಿನಿಧ್ಯವಾಗಿದೆ.
ಉದಾಹರಣೆಗೆ, ದೃಶ್ಯೀಕರಣ
ವಿಶ್ಲೇಷಣೆಯ ಒಂದು
ಭಾಗವಾಗಿದೆ.
ನೀವು ಏನನ್ನಾದರೂ ಯೋಜಿಸಿ,
ಡೇಟಾದಿಂದ ಏನನ್ನಾದರೂ
ವೀಕ್ಷಿಸಲು ಪ್ರಯತ್ನಿಸಿದಾಗ,
ಇದು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ
ಭಾಗವಾಗಿದೆ.

Bengali: 
এবং আমরা সেই বৈশিষ্ট্যগুলি
বের করতে চাই।
ইসিজি দেখায় এমন
একজন ডাক্তার যা
মূলত সেই শিখরগুলির
জন্য অনুসন্ধান করে,
এবং সেই শিখরগুলিতেও
ত্রুটিগুলি অনুসন্ধান
করে, এবং সেই অসংলগ্ন
একটি অস্বাস্থ্যকর
হৃদয়ের চিহ্ন হতে
পারে, উদাহরণস্বরূপ।
সুতরাং, বৈশিষ্ট্য
নিষ্কাশন খুবই সাধারণ,
না শুধুমাত্র বায়োমেডিক্যাল
মধ্যে, কিন্তু সর্বত্র।
এবং ক্লাসিফিকেশন।

Gujarati: 
છો - તે ડેટા એનાલિસિસ(
data analysis) નથી; તે માત્ર
તે અભ્યાસનો એક અત્યંત
નાનો ભાગ છે જેટલું

Malayalam: 
ഇത് ഒരു മോഡല്‍ നിര്‍മ്മിക്കുന്നതുപോലെ
ഒരു വലിയ വിശകലനത്തിന്‍റെ
ഭാഗമായിരിക്കാം.
വിവരണപരമായ വിശകലനം
നേരിട്ട് വലിയ വിശകലനത്തിന്‍റെ
ഭാഗമാകുന്നില്ല.
ഇത് സാധാരണയായി ഡാറ്റ
വിശകലനത്തില്‍ ആദ്യപടിയാണ്.
പിന്നെ, നിങ്ങള്‍ക്ക്
പ്രവചിക്കാനാവുന്ന
അല്ലെങ്കില്‍ അനുശാസനപരമായ
വിശകലനങ്ങള്‍ ഉണ്ട്.
പ്രവചനാത്മകമായ
വിശകലനം ഡാറ്റയെ
അടിസ്ഥാനമാക്കി
പ്രോസസ് എവിടെയാണ്
ഹെഡ് ചെയ്യുന്നത്
എന്ന് ചോദിക്കുന്നു.
പല പ്രയോഗങ്ങളിലും
ഇത് വളരെ പ്രയോജനകരമാണ്.
എന്നാല്‍ അനുശാനപരമായ
വിശകലനങ്ങളില്‍
എന്തെങ്കിലുമൊക്കെ
എന്തുകൊണ്ടാണ് സംഭവിച്ചതെന്ന്
ചോദിക്കുന്നു.
ഡോക്ടര്‍ എന്ന നിലയില്‍
അല്ലെങ്കില്‍ എഞ്ചിനീയര്‍
അല്ലെങ്കില്‍ ഒരു
സാമ്പത്തിക വിദഗ്ദ്ധനെന്ന
നിലയില്‍ നിങ്ങള്‍
ഡാറ്റ പരിശോധിക്കുന്നു.
നിങ്ങള്‍ ആ മാര്‍ക്കറ്റ്
ഡാറ്റ നോക്കുമ്പോള്‍
പെട്ടെന്ന് ഒരുതകര്‍ച്ചയുണ്ടാകുന്നെങ്കില്‍
അത് നിങ്ങള്‍ നന്നായി
വിലയിരുത്തുകയും
ചെയ്യുന്നു.
എന്തുകൊണ്ടാണ് ഈ
തകരാര്‍ സംഭവിച്ചത്
അല്ലെങ്കില്‍ എന്തുകൊണ്ട്
ഒരു പ്രത്യേകതെറ്റ്
സംഭവിക്കുന്നു എന്നും
അപ്പോള്‍ നിങ്ങള്‍
തീര്‍ച്ചയായും ഇത്
തടയാനായി എങ്ങനെ

Tamil: 
எனவே, இது செயல்முறை
கண்காணிப்பு என்றும்
அறியப்படுகிறது.
தரவுத் டேட்டா அனாலிசிஸ்
(Data Analysis)ல் பட்டியலிடக்கூடிய
பல நோக்கங்கள் உள்ளன,
ஆனால் அவை முக்கியமாக
டேட்டா அனாலிசிஸ்
(Data Analysis) பயன்பாடுகளின்
பெரும்பாலானவற்றை
உள்ளடக்கும்.
நீங்கள் பார்க்க
முடியும் என பயன்பாடு
மிகவும் மாறுபட்டது.
எனவே, ஒரு பகுப்பாய்வுக்காக
நாம் பின்பற்றும்
செயல்முறை, நாம்
பயன்படுத்தும் கருவிகள்
மற்றும் நாம் எடுத்துக்கொள்ளும்
விளக்கங்கள் ஆகியவை
கண்டிப்பாக மாறுபடும்.
(ஸ்லைடு டைம்: 08:10 ஐ
பார்க்கவும்)
எனவே, டேட்டா அனாலிசிஸ்
(Data Analysis)வைப் பார்ப்பது

Bengali: 
একবার আমরা বৈশিষ্ট্যগুলি
এক্সট্র্যাক্ট করলে,
আমরা চিত্রকে শ্রেণীবদ্ধ
করতে চাই।
চিত্র বিশ্লেষণে,
এটি একটি খুব সাধারণ
ব্যায়াম।
আমরা অনুরূপ রং, চুল
রং, অনুরূপ চোখের
রং, এবং সম্মুখের
চামড়া রঙ এবং তাই
মানুষের সঙ্গে শ্রেণীভুক্ত
করার চেষ্টা করুন।

English: 
host of different types of analysis that are
involved and there are many other classifications
that I have not listed.
Typically, good starting points are exploratory
and descriptive analysis and then one proceeds
from there; even if you have decided that
you are going to build a model for prediction
and so on, it is recommended that you explore
the data, you make friends with the data,
and you familiarize yourself with the data,
before you proceed to developing a model,
for example.
Now, in general, the objective of analysis
determines the specific types of analysis
that we have listed here, that would you carry
out. That means, essentially what is the end
use of an analysis, how are you going to use
the information that you extract.
And before we proceed to data analysis, it
may be very useful to know what are the different
types of data that are available, because
primarily as I will mention later, the tools,

Gujarati: 
અમે ડેટા એનાલિસિસ(data
analysis) કરી રહ્યા છીએ,
તેમાં એક સિદ્ધાંત
છે, અને અલબત્ત, અમે

Hindi: 
हैं और कई अन्य वर्गीकरण
हैं जिन्हें मैंने
सूचीबद्ध नहीं किया
है।
आमतौर पर, अच्छे शुरुआती
बिंदु खोजपूर्ण और
वर्णनात्मक विश्लेषण
होते हैं और फिर वहाँ
से आगे बढ़ते हैं;
यहां तक ​​कि अगर
आपने तय किया है कि
आप भविष्यवाणी के
लिए एक मॉडल बनाने
जा रहे हैं और इसी
तरह, यह अनुशंसा की
जाती है कि आप डेटा
का पता लगाएं, आप डेटा
के साथ दोस्त बनाते
हैं, और आप खुद को
डेटा के साथ परिचित
करते हैं, इससे पहले
कि आप एक मॉडल विकसित
करने के लिए आगे बढ़ें
, उदाहरण के लिए।
अब, सामान्य तौर पर,
विश्लेषण का उद्देश्य
उन विशिष्ट प्रकार
के विश्लेषणों को
निर्धारित करता है
जिन्हें हमने यहां
सूचीबद्ध किया है,
जो आप करेंगे।
इसका मतलब है, अनिवार्य
रूप से एक विश्लेषण
का अंतिम उपयोग क्या
है, आप किस तरह से
निकालने वाली जानकारी
का उपयोग करने जा
रहे हैं।
और इससे पहले कि हम
डेटा विश्लेषण (DATA
ANALYSIS)के लिए आगे बढ़ें,
यह जानना बहुत उपयोगी
हो सकता है कि विभिन्न
प्रकार के डेटा क्या

Malayalam: 
മുന്നോട്ടുപോകണമെന്ന്
നിര്‍ദ്ദേശിക്കുന്നു.
അതുകൊണ്ട് നിര്‍ദ്ദിഷ്ട
വിശകലനത്തില്‍ ഉള്‍പ്പെട്ടിരിക്കുന്ന
രോഗനിര്‍ണ്ണയവും
പരിഹാരവും ഉണ്ടാകും.
അതിനാല്‍ വ്യക്തമായും
ഇതില്‍ ഉള്‍പ്പെട്ടിരിക്കുന്ന
വ്യത്യസ്തതരം വിശകലനങ്ങളുണ്ട്.
ഞാന്‍ ലിസ്റ്റ് ചെയ്തിട്ടില്ലാത്ത
നിരവധി വര്‍ഗ്ഗങ്ങളുണ്ട്.
സാധാരണയായി, നല്ല
ആരംഭപോയിന്‍റുകള്‍
പര്യവേക്ഷണം, വിവരണാത്മക
വിശകലനം, തുടര്‍ന്ന്
അവിടെ നിന്ന് ഒരാള്‍ക്ക്
വിശകലനം തുടങ്ങാം.
നിങ്ങള്‍ പ്രവചനത്തിനായുള്ള
ഒരു മോഡല്‍ നിര്‍മ്മിക്കാന്‍
പോകുകയാണെന്ന് തീരുമാനിച്ചുകഴിഞ്ഞാല്‍
പോലും, നിങ്ങള്‍
ഡാറ്റ പര്യവേക്ഷണം
ചെയ്യുക, നിങ്ങള്‍
ഡാറ്റയുമായി യോജിപ്പിലായിരിക്കണം.
നിങ്ങള്‍ ഒരു മാതൃക
വികസിപ്പിക്കുന്നതിന്
മുന്നോട്ടുപോകുന്നതിന്
മുമ്പായി നിങ്ങള്‍
സ്വയം ഡാറ്റയുമായി
പരിചയപ്പെടണം.
ഉദാഹരണത്തിന് ഇപ്പോള്‍,
പൊതുവായി, വിശകലനം
എന്ന ലക്ഷ്യം ഞങ്ങള്‍
ഇവിടെ നല്‍കിയിരിക്കുന്ന
പ്രത്യേകതരം വിശകലനം
നിര്‍ണ്ണയിക്കുന്നു.
നിങ്ങള്‍ അത് നടപ്പിലാക്കും.
അതിനര്‍ത്ഥം ഒരു
വിശകലനത്തിന്‍റെ
അന്തിമഉപയോഗം എന്താണ്
എന്നതിന്‍റെ അടിസ്ഥാനത്തില്‍
നിങ്ങള്‍ എങ്ങനെയാണ്
വിവരങ്ങള്‍ ഉപയോഗിക്കാമെന്നറിയണം.
നാം ഡാറ്റ വിശകലനത്തിലേക്ക്
പോകുമ്പോള്‍, ലഭ്യമായ

Kannada: 
ಇದು ಬಹಳ ಮುಖ್ಯವಾದ
ಭಾಗವಾಗಿದೆ ಅಥವಾ ನಾನು
ಚರ್ಚಿಸಿದಂತೆ ಅಥವಾ
ನೀವು ಮಾದರಿಗಳನ್ನು
ನಿರ್ಮಿಸಲು ಮತ್ತು
ಹೀಗೆ ಮಾಡಬಹುದು ಎಂದು
ನೀವು ಪ್ಯಾರಾಮೀಟರ್
ಅಂದಾಜನ್ನು ನಿರ್ವಹಿಸಬಹುದು.
ಅಂತಿಮವಾಗಿ, ನಾನು
ವಿವರಿಸಿದಂತೆ ಈ ಡೇಟಾ
ವಿಶ್ಲೇಷಣೆಯ ಫಲಿತಾಂಶಗಳು
ಈ ವಿಶಾಲವಾದ ಕೆಲವು
ಅನ್ವಯಗಳಿಗೆ ಹೋಗುತ್ತದೆ;
ಇದು ಪ್ರಕ್ರಿಯೆಯ ಮೇಲ್ವಿಚಾರಣೆಗಾಗಿ
ಆಗಿರಬಹುದು; ಇದು ತಪ್ಪು
ಪತ್ತೆಯಾಗಿದೆ ಅಥವಾ
ಪ್ರಕ್ರಿಯೆಯ ನಿಯಂತ್ರಣಕ್ಕಾಗಿರಬಹುದು,
ಅಲ್ಲಿ ನಾನು ಮಾಪನಗಳ
ಆಧಾರದ ಮೇಲೆ ಪ್ರತಿಕ್ರಿಯೆಯನ್ನು
ತೆಗೆದುಕೊಳ್ಳುತ್ತಿದ್ದೇನೆ.
ಆದ್ದರಿಂದ, ನಿಯಂತ್ರಕವು
ಡೇಟಾದಲ್ಲಿ ತೆಗೆದುಕೊಳ್ಳುತ್ತಿದೆ,
ಕೆಲವು ರೀತಿಯ ವಿಶ್ಲೇಷಣೆಯನ್ನು
ನಿರ್ವಹಿಸುತ್ತದೆ,
ಮತ್ತು ನಂತರ, ಇನ್ಪುಟ್
ಹೇಗೆ ಚಲಿಸಬೇಕು ಎಂದು
ನಿರ್ಧರಿಸುತ್ತದೆ.
ಅದು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
ಅಥವಾ ಆಪ್ಟಿಮೈಸೇಶನ್ಗಳ

Marathi: 
करणे पुढे जाण्यापूर्वी
, उदाहरणार्थ.
आता, सर्वसाधारणपणे,
विश्लेषणाचा उद्देश
आपण येथे सूचीबद्ध
केलेल्या विशिष्ट
प्रकारच्या विश्लेषणांचे
निर्धारण करतो, आपण
ते कसे कराल?
याचाच अर्थ असा की,
एखाद्या विश्लेषणाचा
शेवटी उपयोग काय
आहे, आपण काढलेल्या
माहितीचा आपण वापर
कसा करणार आहात?
आणि डेटा विश्लेषणात
जाण्यापूर्वी, उपलब्ध
असलेल्या विविध प्रकारचे
डेटा काय हे जाणून
घेणे फारच उपयोगी
ठरू शकते कारण प्रामुख्याने
मी नंतर नंतर साधने,
व्याख्या, आणि इतर
अनेक पावले डेटाच्या
स्वरूपावर अवलंबून
असतात.
आता, पुन्हा एकदा,
आपण डेटा विश्लेषण
साहित्य वळता तेव्हा
आपल्याला विविध प्रकारचे
वर्गीकरण सापडेल,
अनेक वर्गीकरण अस्तित्वात
आहेत उदाहरणार्थ,
आपल्याला अंकीय आद्याचे
वर्गीकृत वर्गीकरण
किंवा स्थिर राज्य
आकृत्या गतिशील आणि
अशीच सापडतील, परंतु
मी खरोखरच त्याबद्दल
बोलणार नाही, कारण
हे निश्चितपणे महत्त्वाचे
आहे, परंतु जे लोक
अधिक दुर्लक्ष करतात,
कमीत कमी सुरुवातीच्या

Malayalam: 
വിവിധതരം ഡാറ്റ എന്താണെന്ന്
അറിയുന്നത് വളരെ
പ്രയോജനകരമാകാം.
കാരണം, പിന്നീടത്
ഞാന്‍ സൂചിപ്പിക്കാം.
ഉപകരണങ്ങളും വ്യാഖ്യാനങ്ങളും
മറ്റ് നിരവധി നടപടികള്‍
ഡാറ്റയുടെ സ്വഭാവത്തെ
ആശ്രയിച്ചിരിക്കുന്നു.
ഇപ്പോള്‍ നിങ്ങള്‍
വീണ്ടും ഡാറ്റ വിശകലന
സാഹിത്യത്തിലേക്ക്
തിരിക്കുമ്പോള്‍
വ്യത്യസ്തമായ പല
വര്‍ഗ്ഗീകരണങ്ങളും
നിലനില്‍ക്കുന്നു.
ഉദാഹരണമായി, സംഖ്യാശാസ്ത്രപരമായ
അല്ലെങ്കില്‍ വര്‍ഗ്ഗീയമായ
വര്‍ഗ്ഗീകരണം അല്ലെങ്കില്‍
ചലനാത്മകമായ അല്ലെങ്കില്‍
സ്ഥിരമായ തരങ്ങള്‍
കാണാം.
പക്ഷേ അവയെപ്പറ്റി
ഞാന്‍ സംസാരിക്കാന്‍
പോകുന്നില്ല.
കാരണം, അത് തീര്‍ച്ചയായും
പ്രധാനമാണ്.
എന്നാല്‍ പലപ്പോഴും
അവ അവഗണിക്കുകയാണ്.
കുറഞ്ഞത് തുടക്കക്കാര്‍
നിര്‍ണ്ണായകമായ
പദങ്ങളുടെ ആധികാരികത
അല്ലെങ്കില്‍ വംശനാശഭീഷണിയിലുള്ള
ഡാറ്റാ വിശകലനം പലപ്പോഴും
അവഗണിക്കുകയാണ്.
ഇത് വളരെ പ്രധാനപ്പെട്ടതാണ്.
കാരണം ഒരു സിദ്ധാന്തത്തിന്‍റെ
നിര്‍ണ്ണായകമായ
പ്രക്രിയയാണത്.
അല്ലെങ്കില്‍ ഡാറ്റ
പുറത്തുവന്നതായി
നിങ്ങള്‍ കരുതുന്ന
നിമിഷത്തില്‍ തന്നെ
സൈദ്ധാന്തികമായി
അത് വലിയ വ്യത്യാസത്തിലാണ്

English: 
the interpretations, and so many other steps
depend on the nature of the data. Now, once
again, when you turn to data analysis literature,
you will find different types of classification,
a number of classifications exist. For example,
you may find numerical verses categorical
classification or steady state verses dynamic
and so on, but I am not going to really talk
about those, because that’s definitely important,
but what is more important which people often
ignore, at least beginners, in data analysis
often ignore is this classification of deterministic
verses random or stochastic data. That’s
very, very important because theoretically
itself or the theory itself largely differs
the moment you say the data has come out of
a deterministic verses stochastic process.
Now, of course, some people use the term random.

Kannada: 
ಅನ್ವಯಗಳ ಒಂದು ಭಾಗವಾಗಿದೆ,
ನಾನು ಪ್ರಕ್ರಿಯೆಯನ್ನು
ಕಾರ್ಯಗತಗೊಳಿಸುವ
ಒಂದು ಉತ್ತಮವಾದ ವಿಧಾನದೊಂದಿಗೆ
ಬರಲು ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದೇನೆ
ಅಥವಾ ಪ್ರಕ್ರಿಯೆಗೆ
ನಾವೀನ್ಯತೆಗಳನ್ನು
ಅಥವಾ ಬದಲಾವಣೆಗಳನ್ನು
ಮಾಡುವ ಪ್ರಯತ್ನಿಸುತ್ತೇನೆ.
ನಂತರ, ಸಹಜವಾಗಿ, ನಾನು
ಇಲ್ಲಿ ಪಟ್ಟಿ ಮಾಡಿರದ
ಕೆಲವು ಅಪ್ಲಿಕೇಶನ್ಗಳು
ಇವೆ, ಆದರೆ ಅಂತಿಮವಾಗಿ
ನೀವು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
ರಸ್ತೆಯ ಅಂತ್ಯವಲ್ಲ
ಎಂದು ಅರ್ಥೈಸಿಕೊಳ್ಳಬೇಕು,
ಆದರೆ ಇದು ನಿಜವಾಗಿಯೂ
ಬಹಳ ಬಹಳ ವಿಮರ್ಶಾತ್ಮಕವಾದ
ದತ್ತಾಂಶ ಚಾಲಿತ ಪ್ರಕ್ರಿಯೆಯಾಗಿದೆ,
ವಿಶ್ಲೇಷಣೆ ಪ್ರಕ್ರಿಯೆ
ಕಾರ್ಯಾಚರಣೆಗಳು ಮತ್ತು
ಇನ್ನೂ; ಮತ್ತು ನಾನು
ಇಲ್ಲಿ ಪ್ರಕ್ರಿಯೆಯನ್ನು
ಹೇಳಿದಾಗ, ನಾನು ಮೊದಲೇ
ಹೇಳಿದಂತೆ, ಅದರ ಸಾಮಾನ್ಯವಾದ
ಸಾಮಾನ್ಯ.
ಮತ್ತು ಈ ಎಲ್ಲಾ, ವಾಸ್ತವವಾಗಿ,
ಡೊಮೇನ್ ಜ್ಞಾನ ನಾನು

Hindi: 
हैं जो उपलब्ध हैं,
क्योंकि मुख्य रूप
से जैसा कि मैं बाद
में उल्लेख करूंगा,
उपकरण, व्याख्याएं
और इतने सारे अन्य
कदम प्रकृति की प्रकृति
पर निर्भर करते हैं
आँकड़े।
अब, एक बार फिर, जब
आप डेटा विश्लेषण
(DATA ANALYSIS)साहित्य की
ओर मुड़ेंगे, तो आपको
विभिन्न प्रकार के
वर्गीकरण मिलेंगे,
कई वर्गीकरण मौजूद
हैं।
उदाहरण के लिए, आप
संख्यात्मक छंदों
को वर्गीकृत वर्गीकरण
या स्थिर राज्य छंद
गतिशील और इतने पर
मिल सकते हैं, लेकिन
मैं वास्तव में उन
लोगों के बारे में
बात नहीं कर रहा हूं,
क्योंकि यह निश्चित
रूप से महत्वपूर्ण
है, लेकिन अधिक महत्वपूर्ण
है कि लोग अक्सर कम
से कम शुरुआती, अनदेखा
करते हैं डेटा विश्लेषण
(DATA ANALYSIS)अक्सर अनदेखा
होता है यह निर्धारिती
छंद यादृच्छिक या
स्टोकास्टिक डेटा
का वर्गीकरण है।
यह बहुत महत्वपूर्ण
है क्योंकि सैद्धांतिक
(THEORETICAL) रूप से स्वयं
या सिद्धांत स्वयं
उस क्षण को अलग करता
है जब आप कहते हैं
कि डेटा एक निर्धारक
छंद स्टोकैस्टिक
प्रक्रिया से बाहर
आया है।
अब, निश्चित रूप से,
कुछ लोग यादृच्छिक
शब्द का उपयोग करते
हैं।

Gujarati: 
ડેટા એનાલિસિસ(data
analysis)ના સિદ્ધાંત પર
નથી જતા, પરંતુ અર્થપૂર્ણ
પરિણામો મેળવવા માટેની
એક અનુસરવાની રીત
છે. સૌ પ્રથમ, આપણે

Bengali: 
এবং তারপর, এই সব কেন্দ্রিয়
অনুমান পরীক্ষা করা
হয়।
অনুমান পরীক্ষা কি?
এটি বিশ্লেষণের একটি
খুব, খুব সাধারণ ব্যায়াম,
যেখানে গবেষক সত্য
হচ্ছে কিছু হচ্ছে
উদাহরণস্বরূপ, ধরুন
আমি পরিব্যাপ্ত তাপমাত্রা
তথ্য সংগ্রহ করি।
যে আমার রুমে বাইরে,
আমি একটি সেন্সর
নিতে এবং প্রায়
এক ঘন্টা বা তাই হতে

Tamil: 
பயனுள்ளதாக இருக்கும்,
மேலும் இது டேட்டா
(Data) இயக்க அனாலிசிஸ்
(Analysis) பரந்த திட்டத்தில்
பொருந்துகிறது.
எனவே, இங்கே இந்த
சித்திர பிரதிநிதித்துவம்
அனாலிசிஸ் (Analysis) பொருந்தும்
அங்கே சில யோசனை
கொடுக்க முயற்சிக்கும்.
திட்டத்தின் மேல்,
நீங்கள் செயல்முறை,
மற்றும் இந்த செயல்முறை
மிகவும் பொதுவான
செயல்முறை ஆகும்;
அது ஒரு இன்ஜினியரிங்
(Engineering) செயல்முறை
அல்ல; அது ஒரு சமூக
செயல் அல்லது உயிரியல்
செயல்முறையாக இருக்கலாம்.
மற்றும் செயலாக்கத்தில்
இருந்து தரவை சேகரிக்கும்

Marathi: 
काळात अधिक महत्वाचे
आहेत डेटा विश्लेषण
अनेकदा दुर्लक्ष
केले जाते की निर्धारणीय
अध्याय यादृच्छिक
किंवा स्टॉकेस्टिक
डेटाचे हे वर्गीकरण
आहे. हे फार महत्वाचे
आहे कारण सैद्धांतिकतेने
स्वत: किंवा सिद्धांत
स्वतःहून वेगळा आहे
जे आपण म्हणता त्याप्रमाणे
डेटा निर्णायक पद्यांच्या
स्टॉकेस्टिक प्रक्रियेतून
बाहेर आला आहे. आता,
काही लोक यादृच्छिक
शब्द वापरतात.
यादृच्छिक आणि स्टोचastic
दरम्यान एक सुटल
फरक आहे; तथापि, आपण
येथे फरक पाहू नये.
कधीकधी, नॉन-डिटरमिनिझी
शब्द वापरला जातो.
हे वर्गीकरण किंवा
फरक महत्त्वाचा का
हे विचारण्यापूर्वी,
आपण परिभाषांचे परीक्षण
करूया आणि परिभाषा
डेटा निर्मिती प्रक्रियेवर
आधारित आहेत. तर, डिप्टरनेस्टिक
आणि स्टोचिस्टिक
क्वालिफायर डेटासाठी
नाही, प्रत्यक्षात
ते डेटा तयार करत
असलेल्या प्रक्रियेसाठी
क्वालिफायर आहेत.
डेटा विश्लेषणात,
डेटा निर्मितीची
प्रक्रिया एक अतिशय
महत्त्वाची संस्था
आहे. डेटा निर्मिती
प्रक्रियेद्वारे
काय अर्थ होतो ते
आपण आपल्या प्रायोगिक
प्रक्रियेसह डेटा
एकत्रित करीत असलेली
प्रक्रिया आहे. तेच

Hindi: 
यादृच्छिक और स्टोकास्टिक
के बीच एक सूक्ष्म
अंतर है; हालांकि,
हम यहां उस भेद का
पालन नहीं करेंगे।
कभी-कभी, गैर-निर्धारिती
शब्द का उपयोग किया
जाता है।
इससे पहले कि हम पूछें
कि यह वर्गीकरण या
भेद महत्वपूर्ण क्यों
है, आइए देखें कि परिभाषाएं
और परिभाषा डेटा
जनरेटिंग प्रक्रिया
पर आधारित हैं।
इसलिए, निर्धारिती
और स्टोकास्टिक क्वालीफायर
प्रति डेटा के लिए
नहीं हैं, वास्तव
में, वे डेटा उत्पन्न
करने वाली प्रक्रिया
के लिए क्वालीफायर
हैं।
डेटा विश्लेषण (DATA
ANALYSIS)में, डेटा जनरेटिंग
प्रक्रिया एक बहुत
ही महत्वपूर्ण इकाई
है।
डेटा जनरेटिंग प्रक्रिया
द्वारा हमारा क्या
मतलब है यह प्रक्रिया
है कि आप डेटा के साथ-साथ
अपनी प्रयोगात्मक
प्रक्रिया एकत्र
कर रहे हैं।
इस तरह आप प्रयोग
आयोजित किया जाता
है।
तो, एक साथ रखो, सब
कुछ डेटा उत्पन्न
करने की प्रक्रिया
है।
यह सिर्फ भौतिक प्रक्रिया
ही नहीं है जिसका
आप विश्लेषण कर रहे
हैं।
यह याद रखना बहुत
महत्वपूर्ण है क्योंकि
दोनों आपके द्वारा
जेनरेट किए गए डेटा
के प्रकार में योगदान
देते हैं।
उदाहरण के तौर पर,
हम कहते हैं, मैं कुछ

Malayalam: 
ഇപ്പോള്‍, ചില ആളുകള്‍
random എന്ന പദം ഉപയോഗിക്കുന്നു.
random എന്നതും stochastic എന്നതും
തമ്മില്‍ പല വ്യത്യാസങ്ങളുമുണ്ട്.
എന്നിരുന്നാലും,
ഞങ്ങള്‍ ഈ വ്യത്യാസം
ഇവിടെ കണക്കാക്കുന്നില്ല.
ചിലപ്പോള്‍ nondeterministic
പദമാണുപയോഗിക്കുന്നത്.
ഈ വര്‍ഗ്ഗീകരണം അല്ലെങ്കില്‍
വ്യത്യാസം എന്തുകൊണ്ടാണ്
പ്രാധാന്യം എന്ന്
ചോദിക്കുന്നതിന്
മുമ്പ്, നിര്‍വ്വചനങ്ങള്‍
പരിശോധിക്കണം.
ആ നിര്‍വ്വചനങ്ങള്‍
ഡാറ്റ ഉണ്ടാകുന്ന
പ്രക്രിയയെ അടിസ്ഥാനമാക്കിയാണ്.
അങ്ങനെ, നിര്‍ണ്ണായകവും
ആചാരപരമായതുമായ
യോഗ്യതകള്‍ ഡാറ്റയ്ക്കായി
അല്ല, യഥാര്‍ത്ഥത്തില്‍,
അവര്‍ ഡാറ്റ സൃഷ്ടിക്കുന്ന
പ്രക്രിയയക്ക് യോഗ്യരാണ്.
ഡാറ്റ വിശകലനത്തില്‍,
ഡാറ്റാ ഉല്പാദനപ്രക്രിയ
വളരെ പ്രധാനമാണ്.
ഡാറ്റ സൃഷ്ടിക്കുന്ന
പ്രക്രിയ എന്ന് ഞങ്ങള്‍
അര്‍ത്ഥമാക്കുന്നത്
നിങ്ങളുടെ പരീക്ഷണാത്മക
പ്രക്രിയയും ഡാറ്റ
ശേഖരിക്കുന്ന പ്രക്രിയയുമാണ്.
അതായത് നിങ്ങള്‍
എങ്ങനെയാണ് പരീക്ഷണം
നടത്തിയത് അതിനാല്‍
അവയെല്ലാം ഒന്നിച്ച്
ചേരുന്നതാണ് ഡാറ്റ
സൃഷ്ടിക്കുന്ന പ്രക്രിയയെന്നത്.
നിങ്ങള്‍ വിശകലനം
ചെയ്യുന്ന ഭൗതികപ്രക്രിയ
മാത്രമല്ല ഇത്. നിങ്ങള്‍
ഓര്‍ത്തുവെയ്ക്കാന്‍
വളരെ പ്രധാനമാണ്.

Bengali: 
পারে জন্য পরিবেষ্টিত
তাপমাত্রা সংগ্রহ।
এবং আমি ফিরে আসি
এবং অনুমান করি যে,
এক ঘন্টার সময় তাপমাত্রা
২৫ ডিগ্রী সেলসিয়াস।
এখন যে একটি সত্য
যে আমি গড় তাপমাত্রা
জন্য অনুমান করা
এবং হাইপোথিসিস টেস্টিং
সম্পর্কে আমি যে
তথ্য সংগ্রহ করেছি

Marathi: 
तुम्ही प्रयोग केले
आहे. तर, एकत्र ठेवले,
सर्वकाही डेटा निर्मिती
प्रक्रिया आहे. आपण
विश्लेषण करत आहात
केवळ तो केवळ भौतिक
प्रक्रिया नाही.
लक्षात ठेवणे अत्यंत
महत्त्वाचे आहे कारण
दोन्ही आपण निर्माण
केलेल्या डेटा प्रकारावर
योगदान करतात.
उदाहरण म्हणून, आपण
असे म्हणूया, मी काही
अणुभट्ट्यांचे तापमान
पाहत आहे जे शीतलक
प्रवाहाने नियंत्रित
आहे. अणुभट्ट्यामध्ये
हे खूप सामान्य आहे.
आता मी ज्या अणुभुतीचे
निरीक्षण करत आहे
ती एक भौतिक प्रक्रिया
आहे. तिथे नियंत्रण
ठेवण्याचा प्रयत्न
करणारे कंट्रोलर
आहे. आता हे तापमान
नियंत्रित करण्याचा
एक विलक्षण कार्य
करत आहे असे म्हणूया.
तर, तापमान त्याच्या
सेट पॉईंटवर धरले
जाते, परंतु मी जो
सेन्सर वापरत आहे
तो खूप त्रुटिउत्पन्न
करणारा असतो. शेवटी,
माझ्याकडे येणारा
डेटा प्रक्रिया,
भौतिक प्रक्रिया
आणि मला संवेदक आणि
त्या सेन्सर वैशिष्ट्यांमधील
डेटा यामधील प्रक्रियेतून

English: 
There is a suttle difference between random
and stochastic; however, we will not observe
that distinction here. Sometimes, the term
non-deterministic is used. Before we ask why
this classification or distinction is important,
let’s look at the definitions and the definitions
are based on the data generating process.
So, the deterministic and stochastic qualifiers
are not for the data per se, it is actually,
they are qualifiers for the process that is
generating data. In data analysis, the data
generating process is a very important entity.
What we mean by data generating process is
the process that you are collecting data from
as well as your experimental process. That
is how you are conducted the experiment. So,
put together, everything is the data generating
process. It’s not just the physical process
alone that you are analyzing. That’s very
important to remember because both contribute

Tamil: 
உணரிகள் மற்றும்
இந்த சென்சார்கள்
(sensor) மட்டும் பாரம்பரிய
ஹார்ட்வர் (hardware) அல்லது
கருவி சென்சார்கள்
(sensor) இருக்க வேண்டும்.
இது மனித உணர்கருவிகளாகவும்
இருக்கலாம்.
நாம் கணக்கெடுப்பு
தரவை சேகரிக்கும்
போது, ​​நாம் உண்மையில்
சென்சார்கள் (sensor)
ஆகும்.
இறுதியில், எங்களுடன்
டேட்டா (Data) உள்ளது,
மேலும் பயணத் தரவு
பகுப்பாய்வு தொடங்குகிறது.
இந்த தொகுதி, நிச்சயமாக,
நாம் தரவு சேகரிக்க
எப்படி பற்றி பேச
போவதில்லை, மாதிரி
உத்திகள் மற்றும்
பல; தரவுகளை பகுப்பாய்வு
செய்வதில் நாம் மிகவும்
கவலைப்படுகிறோம்.

Gujarati: 
પૂછવું જોઈએ - ડેટા
એનાલિસિસ(data analysis) શું
છે?
માહિતીનું એનાલિસિસ(analysis)
નિરીક્ષણમાંથી ઉપયોગી,

Kannada: 
ಇಲ್ಲಿ ಹೈಲೈಟ್ ಎಂದು
ಬಹಳ ಮುಖ್ಯ, ಮತ್ತು
ನಾವು ಸ್ಥೂಲವಾದ ಹಿಂದಿರುಗಿ
ಮತ್ತು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಒಳಗೊಂಡಿರುವ ವ್ಯವಸ್ಥಿತ
ಪ್ರಕ್ರಿಯೆಯನ್ನು
ಚರ್ಚಿಸಲು ನಾವು ಸ್ವಲ್ಪ
ನಂತರ ಈ ಬಗ್ಗೆ ಮಾತನಾಡಬಹುದು.
ಆದ್ದರಿಂದ, ಆಶಾದಾಯಕವಾಗಿ,
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಸೂಕ್ತವಾದಲ್ಲಿ
ನೀವು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತೀರಿ.
ಇದು ವಾಸ್ತವವಾಗಿ ವೀಕ್ಷಣೆ
ಪ್ರಪಂಚವನ್ನು ಮಾಹಿತಿಯನ್ನು
ಪ್ರಪಂಚಕ್ಕೆ ಸಂಪರ್ಕಿಸುತ್ತದೆ.
ನಿಮ್ಮ ವಿಶ್ಲೇಷಣೆಯ
ಅವಶ್ಯಕತೆ ಮತ್ತು ಕೊನೆಯ
ಬಳಕೆಯ ಆಧಾರದ ಮೇಲೆ
ಈಗ ವಿಭಿನ್ನ ರೀತಿಯ
ವಿಶ್ಲೇಷಣೆಗಳಿವೆ,
ನಿಸ್ಸಂಶಯವಾಗಿ, ಮತ್ತು
ಸಾಹಿತ್ಯದಲ್ಲಿ ನೀವು
ಕಾಣಬಹುದಾದ ಹಲವಾರು
ವರ್ಗೀಕರಣಗಳಿವೆ.
ನಾನು ಇಲ್ಲಿ ಪಟ್ಟಿ
ಮಾಡಲಾಗಿರುವ ಯಾವುದಾದರೂ
ವಿಧಾನವು ಸಮಗ್ರವಾಗಿಲ್ಲ.
ನೀವು ನೋಡಿದ ವಿಶ್ಲೇಷಣೆಯ
ಸಾಮಾನ್ಯ ವರ್ಗೀಕರಣಗಳಲ್ಲಿ

Marathi: 
थेट नाही. त्या सेंसरची
वैशिष्ट्ये प्रत्यक्षात
डेटामध्ये जातात.
सेंसर खूप त्रुटि
करणारा असल्यास,
आपण त्रुटिमय डाटासह
समाप्त होणार आहात.
सेन्सर पक्षपाती
असेल तर आपला डेटा
पूर्वाभिमुख दर्शवेल.
आता, डेटा निर्मिती
प्रक्रियेत अणुभट्टी
आणि सेन्सर दोन्हीचा
समावेश आहे. डीजीपी
-आम्ही साहित्यमधुन
एक संक्षेप म्हणून
वापर करू - ज्याचा
निर्धारक विचार असेल,
जर आपण गणितीय फंक्शन
शोधू शकू जे योग्यपणे
डेटा समजावून सांगू
शकेल; म्हणजेच डेटाचा
अंदाज लावू शकतो,
आपण पूर्णपणे फिट
असू शकता, प्रत्येक
डेटा बिंदू हा गणितीय
फंक्शनच्या वक्र
वर आहे. ते पाहण्याचा
हा एक मार्ग आहे किंवा
आपण असे म्हणू शकता
की आपण डेटा निर्मिती
प्रक्रियेस पूर्णपणे
समजून घेतले आहे;
असे काही नाही जे
आपण समजू शकत नाही
किंवा आपण असे म्हणू
शकता की साजरा मूल्यांमध्ये
अनिश्चितता नाही.
आपण असू शकतात ... बर्याचदा
काय घडते आहे आपणास
भौतिक प्रक्रियेचे
अतिशय चांगले ज्ञान

Kannada: 
ಒಂದಾದ ಪರಿಶೋಧನಾ ಪದ್ಯಗಳು
ದೃಢೀಕರಣವಾಗಿದೆ.
ಪರಿಶೋಧನಾತ್ಮಕ ರೀತಿಯ
ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ,
ನೀವು ಏನನ್ನಾದರೂ ಮುಂದೂಡುವುದಿಲ್ಲ,
ಆದರೆ ನೀವು ಕೇವಲ ಡೇಟಾವನ್ನು
ಅನ್ವೇಷಿಸುತ್ತಿದ್ದೀರಿ
ಮತ್ತು ನಿಮ್ಮ ಪ್ರಕ್ರಿಯೆಯನ್ನು
ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು
ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದೀರಿ.
ಉದಾಹರಣೆಗೆ, ಇದು ಸರಾಸರಿ
ಅಥವಾ ಪ್ರಮಾಣಿತ ವಿಚಲನ
ಅಥವಾ ಗ್ರ್ಯಾಫ್ಗಳನ್ನು
ನೋಡುವ ಸಾಧ್ಯತೆ ಇದೆ,
ಪ್ರಕ್ರಿಯೆಯು ರೇಖಾತ್ಮಕ
ಅಥವಾ ಸ್ಟೇಷನರಿ ಮತ್ತು
ಇನ್ನಿತರೆ ಎಂಬುದನ್ನು
ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು
ಪ್ರಯತ್ನಿಸುತ್ತದೆ;
ಈ ಪ್ರಕ್ರಿಯೆಯು ಆಸಿಲೇಟರಿ(oscillatory)
ಎಂಬುದನ್ನು ನಿರ್ಣಯಿಸಲು
ಪ್ರಯತ್ನಿಸುತ್ತಿದೆ.
ಸಾಕಷ್ಟು ದೃಶ್ಯ ಮತ್ತು
ಕೆಲವು ವಿವರಣಾತ್ಮಕ
ಅಂಕಿಅಂಶಗಳ ವಿಶ್ಲೇಷಣೆ
ಇದೆ; ಆದರೆ ದೃಢೀಕರಣ
ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ,
ನೀವು ಮುನ್ನುಡಿಯನ್ನು
ಮುಂದೂಡಬಹುದು, ಮತ್ತು
ನೀವು ಮನಸ್ಸಿನಲ್ಲಿರುವುದು

Gujarati: 
સંબંધિત અને અર્થપૂર્ણ
માહિતી કાઢવા વિશે
છે. જેમ મેં કહ્યું,
અમે વિવિધ ક્ષેત્રો
અને વિવિધ સ્વરૂપોમાં
ડેટા એકત્રિત કરીએ

Tamil: 
எனவே, ஒரு முறை நான்
டேட்டா (Data), பொதுவாக
நான் சில நடவடிக்கைகளை
மூலம் அதை வைத்து
நாம் ஒரு பிட் (bit)
பின்னர் பேசுவோம்.
இந்த திட்டத்தின்
நோக்கம் அனாலிசிஸ்
(Analysis) பொருந்தும்
எங்கே நீங்கள் சொல்ல
வேண்டும்.
இங்கே நீங்கள் பெயரிடப்பட்ட
பகுப்பாய்வு பார்க்க
இரண்டு நிலைகளில்,
அது அடிப்படையில்
டேட்டா அனாலிசிஸ்
(Data Analysis) என்ன செல்கிறது
பிரதிநிதித்துவம்
ஆகும்.
எடுத்துக்காட்டாக,
காட்சிப்படுத்தல்
அனாலிசிஸ் (Analysis) பகுதியாகும்.
நீங்கள் ஏதேனும்
சதி செய்தால், டேட்டா

English: 
to the type of data that you generate.
As an example, let us say, I am observing
some reactor temperature which is being controlled
by coolant flow. This is very common in nuclear
reactors and so on. Now, the reactor that
I am observing is a physical process. There
is a controller there trying to control the
temperature and so on. Let’s say it’s
doing a fantastic job of controlling the temperature.
So, the temperature is held at its set point,
but the sensor that I am using can be quite
noisy. Ultimately, the data that comes to
me is not directly from the process between
the process, the physical process and the
data I have a sensor and that sensor characteristics.
The characteristics of that sensor actually
goes into the data. If the sensor is very
noisy, you are going to end up with a noisy
data. If the sensor is a biased, your data
will show a bias.

Malayalam: 
കാരണം നിങ്ങള്‍ സൃഷ്ടിക്കുന്ന
ഡാറ്റ തരം രണ്ടും
സംഭാവന ചെയ്യും.
ഉദാഹരണമായി ഞാന്‍
പറയാം.
ഞാന്‍ ചില റിയാക്ടര്‍
താപനില നിരീക്ഷിക്കുന്നു.
അത് തണുപ്പേറിയ ഒഴുക്ക്
നിയന്ത്രിക്കുന്നു.
ആണവറിയാക്ടറുകളില്‍
ഇത് വളരെ സാധാരണമാണ്.
ഇപ്പോള്‍ ഞാന്‍ നിരീക്ഷിച്ചുകൊണ്ടിരിക്കുന്ന
റിയാക്ടര്‍ ഭൗതികപ്രക്രിയയാണ്.
ചൂട് നിയന്ത്രിക്കാന്‍
ശ്രമിക്കുന്ന ഒരു
കണ്‍ട്രോളറും ഉണ്ട്.
നമുക്ക് ചൂട് നിയന്ത്രിക്കാന്‍
ഒരു മികച്ച ജോലിയാണ്
ചെയ്യുന്നത്.
അങ്ങനെ, താപനില അതിന്‍റെ
സെറ്റ് പോയിന്‍റില്‍
നില്‍ക്കുന്നു.
എന്നാല്‍ ഞാന്‍ ഉപയോഗിക്കുന്ന
സെന്‍സര്‍ കുറച്ച്
പ്രശ്നമുള്ളതാകാം.
ആത്യന്തികമായി എനിക്ക്
കിട്ടുന്ന ഡാറ്റ
പ്രൊസസില്‍ നിന്ന്
നേരിട്ട് ലഭിക്കുന്നതല്ല.
അത് ഫിസിക്കല്‍ പ്രോസസ്
ആണ്. ഡേറ്റയില്‍
സെന്‍സറും അതിന്‍റെ
സവിശേഷതകളും ഉള്‍പ്പെട്ടിരിക്കുന്നു.
ആ സെന്‍സറിന്‍റെ
പ്രത്യേകതകള്‍ യഥാര്‍ത്ഥത്തില്‍
ഡാറ്റയായി മാറുന്നു.
അനാവശ്യമായ സിഗ്നലുകള്‍
സെന്‍സറിലേക്ക്
കടന്നുവരികയാണെങ്കില്‍,
നിങ്ങള്‍ക്ക് ലഭിക്കുന്നതും
അങ്ങനെയുള്ള ഡാറ്റയായിരിക്കും.
സെന്‍സര്‍ ഒരു വ്യതിയാനം
കാണിക്കുകയാണെങ്കില്‍
നിങ്ങളുടെ ഡാറ്റയും
വ്യതിയാനം കാണിക്കും.

Bengali: 
তার উপর ভিত্তি করে
দাবী করে যে আমি এটি
তৈরি করছি কিনা বা
না করায় তা পরীক্ষা
করছে।
সুতরাং, আমি সংগৃহীত
তথ্য একটি প্রমাণ
হিসাবে কাজ করে এবং
আমি আমার হাইপোথিসিসের
সমর্থনে তথ্য প্রমাণের
জন্য অনুসন্ধান করি,
এবং এটি পরিসংখ্যানগতভাবে
সঠিক ভাবে করা উচিত।

Hindi: 
रिएक्टर तापमान देख
रहा हूं जिसे शीतलक
प्रवाह द्वारा नियंत्रित
किया जा रहा है।
परमाणु रिएक्टरों
में यह बहुत आम है
और इसी तरह।
अब, मैं जो रिएक्टर
देख रहा हूं वह एक
शारीरिक प्रक्रिया
है।
वहां एक नियंत्रक
है जो तापमान को नियंत्रित
करने की कोशिश कर
रहा है और इसी तरह।
मान लीजिए कि यह तापमान
को नियंत्रित करने
का शानदार काम कर
रहा है।
तो, तापमान अपने निर्धारित
बिंदु पर आयोजित
किया जाता है, लेकिन
जो सेंसर मैं उपयोग
कर रहा हूं उसमे काफी
शोर हो सकता है।
आखिरकार, मेरे पास
जो डेटा आता है वह
सीधे प्रक्रिया,
भौतिक प्रक्रिया
और डेटा के बीच की
प्रक्रिया से नहीं
है जिसमें मेरे पास
सेंसर है और वह सेंसर
विशेषताएं हैं।
उस सेंसर की विशेषताएं
वास्तव में डेटा
में जाती हैं।
यदि सेंसर बहुत शोर
है, तो आप एक शोर डेटा
के साथ खत्म होने
जा रहे हैं।
यदि सेंसर पक्षपातपूर्ण
है, तो आपका डेटा पूर्वाग्रह
दिखाएगा।
अब, डेटा जनरेटिंग
प्रक्रिया में रिएक्टर
और सेंसर दोनों शामिल
हैं।

Hindi: 
डीजीपी- हम संक्षेप
में उपयोग करेंगे
जो आपको साहित्य
में भी मिलेगा - निर्धारित
करने के लिए निर्धारित
है, यदि आप गणितीय
फ़ंक्शन पा सकते
हैं जो डेटा को सटीक
रूप से समझा सकता
है; यानी, यह डेटा
की भविष्यवाणी कर
सकता है, आप पूरी तरह
से फिट हो सकते हैं,
प्रत्येक डेटा बिंदु
इस गणितीय फ़ंक्शन
के वक्र पर स्थित
है।
यह देखने का एक तरीका
है या आप कह सकते हैं
कि आपने डेटा उत्पन्न
करने की प्रक्रिया
को बिल्कुल समझ लिया
है; ऐसा कुछ भी नहीं
है जिसे आप समझा नहीं
सकते या आप कह सकते
हैं कि मनाए गए मूल्यों
में कोई अनिश्चितता
नहीं है।
आपके पास हो सकता
है ... कई बार ऐसा होता
है कि आपको शारीरिक
प्रक्रिया का बहुत
अच्छा ज्ञान हो सकता
है।
उदाहरण के लिए, उदाहरण
में रिएक्टर जिस
पर हमने पहले चर्चा
की थी मैं गतिशीलता,
कैनेटीक्स, रिएक्टर
में सब कुछ, ऊष्मप्रवैगिकी
और इतने पर समझ सकता
हूं, लेकिन मुझे सेंसर
विशेषताओं का खराब
ज्ञान हो सकता है
अब, यह एक बहुत ही
मुश्किल स्थिति बनाता
है।

Tamil: 
(Data)களிலிருந்து ஏதாவது
ஒன்றைக் கண்காணிக்கும்
போது, ​​அது டேட்டா
அனாலிசிஸ் (Data Analysis)ல்
ஒரு பகுதியாகும்.
இது ஒரு மிக முக்கியமான
பகுதியாகும் அல்லது
நான் விவாதித்த அளவுக்கு
அளவுரு மதிப்பீட்டை
நீங்கள் மேற்கொள்ளலாம்
அல்லது மாதிரிகள்
உருவாக்கலாம்.
இறுதியில், இந்த
டேட்டா அனாலிசிஸ்
(Data Analysis) முடிவுகளை
நான் விளக்கி இந்த
பரந்த பயன்பாடுகள்
சில செல்ல; இது செயல்முறை
கண்காணிப்புக்காக
இருக்கலாம்; அது
தவறான கண்டறிதல்
அல்லது செயல்முறை
கட்டுப்பாட்டிற்காக
இருக்கலாம், அங்கு
அளவீடுகளை அடிப்படையாகக்
கொண்டு நான் கருத்து

Malayalam: 
ഇപ്പോള്‍, ഡാറ്റാ
ഉല്പാദന പ്രക്രിയയില്‍
റിയാക്ടറും സെന്‍സറും
അടങ്ങിയിരിക്കുന്നു.
DGP ڊഞങ്ങള്‍ ഉപയോഗിക്കുന്നത്
ഒരു സാഹിത്യത്തില്‍പോലും
നിങ്ങള്‍ കണ്ടെത്തുന്ന
ഒരു ചുരുക്കെഴുത്തായിരിക്കും.
- നിശ്ചിത കൃത്യതയോടെ
വിശദീകരിക്കാന്‍
കഴിയുന്ന ഒരു ഗണിത
ഫങ്ഷന്‍ കണ്ടെത്താന്‍
കഴിയുന്നുണ്ടെങ്കില്‍
അവ വിശദീകരിക്കാന്‍
കഴിയുന്നതായിരിക്കും.
അതായത്, ഡാറ്റയെ
മുന്‍കൂട്ടി പ്രവചിക്കാം.
നിങ്ങള്‍ക്ക് തികച്ചും
അനുയോജ്യമാകും.
എല്ലാ ഡാറ്റാ പോയിന്‍റും
ഈ ഗണിതപ്രവര്‍ത്തനത്തിന്‍റെ
വക്രം ആകുന്നു.
അത് നോക്കാനുള്ള
ഒരു മാര്‍ഗ്ഗമാണ്,
അല്ലെങ്കില്‍ ഡാറ്റ
സൃഷ്ടിക്കുന്ന പ്രക്രിയ
നിങ്ങള്‍ കൃത്യമായി
മനസ്സിലാക്കിയെന്ന്
പറയാന്‍ കഴിയും.
നിങ്ങള്‍ക്ക് അവിടെ
വിശദീകരിക്കാന്‍
കഴിയാത്ത ഒന്നുമില്ല.
നിരീക്ഷിക്കപ്പെട്ട
മൂല്യങ്ങളില്‍ അനിശ്ചിതത്വം
ഇല്ലെന്ന് നിങ്ങള്‍ക്ക്
പറയാന്‍ കഴിയും.
നിങ്ങളുടെ ഭൗതിക
പ്രക്രിയയെക്കുറിച്ച്
നിങ്ങള്‍ക്ക് വളരെ
നല്ല അറിവുണ്ടാകാം.
ഞങ്ങള്‍ മുമ്പ് ചര്‍ച്ച
ചെയ്ത ഉദാഹരണത്തില്‍
റിയാക്ടറിന്‍റെ
ചലനാത്മകത, ഭൗതികശാസ്ത്രം,
റിയാക്ടറിലെ എല്ലാം,
തെര്‍മോഡൈനാമിക്സ്
തുടങ്ങിയവയെക്കുറിച്ച്
എനിക്കറിയാം.
പക്ഷേ സെന്‍സര്‍
സവിശേഷതകളെക്കുറിച്ച്

Gujarati: 
છીએ, પછી ભલે તે અર્થશાસ્ત્ર
છે, ભલે તે એન્જિનિયરિંગ
અથવા દવા અથવા અન્ય
કોઈ ક્ષેત્ર હોય,

Marathi: 
असू शकते. उदाहरणार्थ,
आम्ही पूर्वी ज्या
पद्धतीने चर्चा केली
त्या रिऍक्टरमध्ये
मी गतिशीलता, कायनेटिक्स,
रिएक्टरमधील सर्व
गोष्टी, उष्मप्रक्रिया
इत्यादी समजू शकतो,
परंतु मला सेन्सर
गुणधर्मांचा अभाव
आहे. आता, हे एक अतिशय
अवघड परिस्थिती बनवते.
हे न ठरविणारी किंवा
नक्षत्रांमधे नाही
आणि आपण याबद्दल
बोलणार आहोत, परंतु
मूलभूत गोष्टी आत्ता
निर्णायक नाही. डाटा
एक निर्धारणीय प्रक्रियेतून
बाहेर येत नाही कारण
डीजीपीचा एक भाग,
जो सेंसर आहे, तो व्यवस्थित
समजू शकत नाही. साधारणतया,
ही परिस्थिती आहे;
सेन्सर्स कधीच पूर्णपणे
समजत नाहीत.
आपण खूप कमी ध्वनी
असलेल्या खूप, खूप
चांगले संवेदक डिझाइन
करू शकता, परंतु कोणतेही
सेन्सर परिपूर्ण
नाही आणि कोणतेही
सेन्सर खरोखरच पूर्णपणे
समजलेले नाही. तर
प्रत्यक्षात एक निर्धारक
प्रक्रिया आहे असे
काही नाही. हे आदर्शवाद
आहे, जे डेटा विश्लेषणात
आणि सिध्दांताचा
विकास करण्यामध्ये

Kannada: 
ಯಾವುದು ಸರಿಯಾಗಿದೆಯೇ
ಅಥವಾ ಇಲ್ಲವೇ ಎಂಬುದನ್ನು
ದೃಢಪಡಿಸಲು ನೀವು ಡೇಟಾವನ್ನು
ಬಳಸುತ್ತೀರಿ.
ಆದ್ದರಿಂದ, ನಿಸ್ಸಂಶಯವಾಗಿ,
ಅಲ್ಲಿ ಸ್ವಲ್ಪ ವಿಭಿನ್ನತೆಯಿದೆ.
ತದನಂತರ, ನೀವು ಪರಿಮಾಣಾತ್ಮಕ
ಶ್ಲೋಕಗಳ ಗುಣಾತ್ಮಕ
ದತ್ತಾಂಶ ವಿಶ್ಲೇಷಣೆಯನ್ನು
ಹೊಂದಿದ್ದೀರಿ.
ಗುಣಾತ್ಮಕ ದತ್ತಾಂಶ
ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ,
ಉದಾಹರಣೆಗೆ, ನೀವು
ಟ್ರೆಂಡ್ಗಳನ್ನು ನೋಡುತ್ತೀರಿ;
ನೀವು ಕೆಲವು ವೈಶಿಷ್ಟ್ಯಗಳು
ಮತ್ತು ಆಂದೋಲನದ ಲಕ್ಷಣಗಳನ್ನು
ಹುಡುಕುತ್ತಿದ್ದೀರಿ.
ಹೇಗಾದರೂ, ಪರಿಮಾಣಾತ್ಮಕವಾಗಿ
ನೀವು ನಿಮ್ಮ ವಿಶ್ಲೇಷಣೆಯಿಂದ
ಸಂಖ್ಯಾತ್ಮಕ ಫಲಿತಾಂಶಗಳನ್ನು
ನೋಡುತ್ತಿದ್ದೀರಿ.
ನಂತರ, ನೀವು ವಿವರಣಾತ್ಮಕ
ಪದ್ಯಗಳನ್ನು ತಾರ್ಕಿಕ
ಎಂದು ಕರೆಯುತ್ತಾರೆ.
ಮತ್ತು ವಿವರಣಾತ್ಮಕ
ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ,
ಮತ್ತೊಮ್ಮೆ, ಇದು ಪರಿಶೋಧನಾತ್ಮಕ
ರೀತಿಯಲ್ಲಿ ಹೆಚ್ಚು
ಅಥವಾ ಕಡಿಮೆಯಾಗಿದೆ;
ತಾರ್ಕಿಕದಲ್ಲಿ ನೀವು
ಡೇಟಾದಿಂದ ನಿರ್ದಿಷ್ಟವಾದ
ಏನನ್ನಾದರೂ ನಿರ್ಣಯಿಸಲು
ಪ್ರಯತ್ನಿಸುತ್ತಿದ್ದೀರಿ
ಮತ್ತು ನೀವು ಅದನ್ನು

English: 
Now, the data generating process consists
of both the reactor and the sensor. The DGP
-as we shall use as an abbreviation that you
will find even in literature - is set to be
deterministic, if you can find a mathematical
function that can accurately explain the data;
that is, it can predict the data, you can
fit in perfectly, every data point lies on
the curve of this mathematical function. That’s
one way of looking at it or you can say that
you have exactly understood the data generating
process; there is nothing that you cannot
explain or that you can say that there is
no uncertainty in the observed values.
You may have… many a times what happens
is you may have very good knowledge of the
physical process. For example, the reactor
in the example that we discussed earlier,
I may understand the dynamics, the kinetics,
everything in the reactor, the thermodynamics
and so on, but I may have poor knowledge of
the sensor characteristics. Now, that makes

Bengali: 
এবং অনুমান পরীক্ষা
প্রতিটি পরিসংখ্যানগত
ইনফারেন্সিং ব্যায়াম
একটি অবিচ্ছেদ্য
অংশ।
এটা অবশ্যই, অনেক
তত্ত্ব, সম্ভাব্যতার
তত্ত্ব, মূল্যায়ন
তত্ত্ব এবং এর সাথেও
জড়িত।
আমরা না, আমরা অনুমান
পরীক্ষার গভীরতার
মধ্যে যেতে হবে না
এবং তাই।
একটি এমওইউসি কোর্স
আছে যা আমরা হাইপোথিসিস

Hindi: 
यह न तो निर्धारक
और न ही stochastic चीज में
डालता है और हम इसके
बारे में बात करेंगे,
लेकिन अनिवार्य रूप
से यह निश्चित नहीं
है।
डेटा एक निर्धारक
प्रक्रिया से बाहर
नहीं आ रहा है क्योंकि
डीजीपी का एक हिस्सा,
जो एक सेंसर है, को
ठीक से समझा नहीं
गया है।
सामान्य रूप से, यह
स्थिति है; सेंसर
कभी पूरी तरह से समझ
में नहीं आता है।
आप एक बहुत ही अच्छे
सेंसर को डिजाइन
कर सकते हैं जिसमें
बहुत कम शोर है, लेकिन
कोई सेंसर सही नहीं
है और कोई सेंसर वास्तव
में पूरी तरह से समझ
में नहीं आता है।
तो, वास्तव में, एक
निर्धारक प्रक्रिया
की तरह कुछ भी नहीं
है।
यह एक आदर्शीकरण
है, जो डेटा विश्लेषण
(DATA ANALYSIS)और सिद्धांत
के विकास में बहुत
उपयोगी है।
अब, जाहिर है, स्टोकेस्टिक
नियतात्मक के लिए
काउंटर हिस्सा है,
जहां हम कहते हैं
कि डीजीपी सटीक रूप
से अनुमानित नहीं
है या इसका पता नहीं
है या आप कह सकते हैं
कि डेटा में अनिश्चितता
है और इसी तरह और जैसा

Tamil: 
நடவடிக்கை எடுக்கிறேன்.
எனவே, கட்டுப்படுத்தி
தரவு எடுத்து, சில
வகையான அனாலிசிஸ்
(Analysis) செய்து, பின்னர்,
உள்ளீடு எவ்வாறு
நகர்த்த வேண்டும்
என்பதை தீர்மானித்தல்.
இது டேட்டா (Data)பகுப்பாய்வு
அல்லது தேர்வுமுறை
பயன்பாடுகளில் ஒரு
பகுதியாகும், நான்
ஒரு செயல்பாட்டை
இயக்க ஒரு உகந்த
வழியில் வர முயற்சி,
அல்லது புதுமைகளை
அல்லது செயல்முறை
மாற்றங்கள் செய்யும்.
பின்னர், நிச்சயமாக,
நான் இங்கே பட்டியலிடப்படவில்லை
என்று சில பயன்பாடுகள்
உள்ளன, ஆனால் இறுதியில்
நீங்கள் தரவு பகுப்பாய்வு
சாலை இறுதியில் அல்ல

Gujarati: 
અમારી પાસે વિવિધ
પ્રકારની માહિતી
એકત્રિત કરવામાં
આવે છે અને ડેટા એકત્ર
કરવાનો હેતુ મૂળભૂત
પ્રક્રિયા વિશે કંઈક

Malayalam: 
എനിക്ക് കുറഞ്ഞ അറിവ്
മാത്രമേ ഉള്ളൂ.
അത് വളരെ ദുഷ്കരമായ
സാഹചര്യമാണ്.
അത് deterministic or stochastic വിഭാഗത്തില്‍
ഉള്ളതല്ല.
അതിനെക്കുറിച്ച്
നമ്മള്‍ സംസാരിക്കും.
പക്ഷേ, അത് തീര്‍ച്ചയായും
നിര്‍ണായകമല്ല.
ഒരു deterministic പ്രക്രിയയില്‍
ഉള്ളതല്ല.
അത് DGP യുടെ ഒരു ഭാഗമാണ്.
അതൊരി സെന്‍സര്‍
ആയതിനാല്‍ ശരിയായി
മനസ്സിലായിട്ടില്ല.
പൊതുവേ, ഇതാണ് അവസ്ഥ.
സെന്‍സറുകള്‍ ഒരിക്കലും
പൂര്‍ണ്ണമായി മനസ്സിലാക്കാന്‍
കഴിഞ്ഞിട്ടില്ല.
നിങ്ങള്‍ക്ക് noise
വളരെ കുറവുളള ഒരു
സെന്‍സര്‍ രൂപകല്പന
ചെയ്യാന്‍ കഴിയും.
എന്നാല്‍ സെന്‍സര്‍
തികച്ചും അപൂര്‍ണ്ണവും
മനസ്സിലാക്കാന്‍
കഴിയില്ലാത്തതുമാണ്.
വാസ്തവത്തില്‍, ഒരു
deterministic പ്രക്രിയയില്ല.
ഇത് ഒരു ആശയവിനിമയമാണ്.
അത് ഡാറ്റ വിശകലനത്തിലും,
സിദ്ധാന്തം വികസിപ്പിക്കുന്നതിലും
വളരെ ഉപയോഗപ്രദമാണ്.
ഇപ്പോള്‍ വ്യക്തമായും
stochastic എന്നത് deterministic
ന്‍റെ പ്രതിപാദ്യവിഷയമാണ്.
DGP കൃത്യമായി പ്രവചിക്കാനാകാത്തതോ
അല്ലെങ്കില്‍ അജ്ഞാതമായതോ
അല്ലെങ്കില്‍ ഡാറ്റയില്‍
അനിശ്ചിതത്വം ഉണ്ടെന്ന്
പറയാനാകുന്നതോ ആകും.
ഞാന്‍ പറഞ്ഞതുപോലെ
പ്രായോഗികമായി പരിപൂര്‍ണ്ണ
പരിജ്ഞാനം അറിയാത്തതിനാല്‍

Bengali: 
টেস্টিংয়ের ভূমিকা
সম্পর্কে শিখতে পারি;
যে সম্ভবত মার্চ
দ্বিতীয় বা তৃতীয়
সপ্তাহে সম্ভবত শুরু
হবে।
এবং যদি আপনি আগ্রহী
হন, তাহলে আপনাকে
এটির মাধ্যমে বসতে
হবে কারণ এটি প্রতিটি
পরিসংখ্যানগত বিশ্লেষণ
বিশ্লেষণের অবিচ্ছেদ্য
অংশ।
তারপর, আমরা ডেটা
বিশ্লেষণ সম্ভবত

Kannada: 
ಊಹಾ ಪರೀಕ್ಷೆಗೆ ಒಳಪಡಿಸುತ್ತೀರಿ.
ಆದ್ದರಿಂದ, ತಾರ್ಕಿಕ
ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ತೊಡಗಿಸಿಕೊಂಡಿರುವ
ಸಾಕಷ್ಟು ವ್ಯವಸ್ಥಿತ,
ಸಂಖ್ಯಾತ್ಮಕ ಮತ್ತು
ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ
ವಿಶ್ಲೇಷಣೆ ಇದೆ, ಮತ್ತು
ಇದು ಒಂದು ಮಾದರಿಯನ್ನು
ನಿರ್ಮಿಸುವಂತಹ ಮತ್ತು
ಹೀಗೆ ಮಾಡುವಂತಹ ದೊಡ್ಡ
ವಿಶ್ಲೇಷಣೆಯ ಭಾಗವಾಗಿರಬಹುದು.
ಆದರೆ, ವಿವರಣಾತ್ಮಕ
ವಿಶ್ಲೇಷಣೆಯು ನೇರವಾಗಿ
ದೊಡ್ಡ ವಿಶ್ಲೇಷಣೆಗೆ
ಆಹಾರವನ್ನು ನೀಡುತ್ತಿಲ್ಲ;
ಇದು ಸಾಮಾನ್ಯವಾಗಿ
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಮೊದಲ ಹಂತವಾಗಿದೆ.
ನಂತರ, ನೀವು ಮುನ್ಸೂಚನೆಯ
ಪದ್ಯಗಳನ್ನು ಸೂಚಿಸುವಂತೆ
ಹೊಂದಿದ್ದೀರಿ.
ಮುನ್ಸೂಚನೆಯ ವಿಶ್ಲೇಷಣೆ
ಪ್ರಕ್ರಿಯೆಯ ಡೇಟಾವನ್ನು
ಆಧರಿಸಿ ಎಲ್ಲಿದೆ ಎಂದು
ಕೇಳುತ್ತದೆ.
ಮತ್ತು ಇದು ಹಲವು ಅನ್ವಯಗಳಲ್ಲಿ
ಬಹಳ ಉಪಯುಕ್ತವಾಗಿದೆ;
ಆದರೆ ಯಾವುದೋ ಸಂಭವಿಸಿದೆ
ಎಂದು ಸೂಚಿಸುವಂತೆ
ಸೂಚಿಸುತ್ತದೆ.

English: 
it a very tricky situation. It puts in neither
in the deterministic nor the stochastic thing
and we will talk about it, but essentially
that is not deterministic anymore. The data
is not coming out of a deterministic process
because a part of the DGP, which is a sensor,
has not been understood properly. In general,
this is the situation; sensors are never perfectly
understood. You can design a very, very nice
sensor that has very less noise, but no sensor
is perfect and no sensor is really perfectly
understood. So, in reality, there is nothing
like a deterministic process. It’s an idealization,
that is very useful in data analysis and in
developing the theory.
Now, obviously, stochastic is the counter
part for the deterministic, where we say that
the DGP is not accurately predictable or its
not known or you can say there is uncertainty
in the data and so on. And as I said, in practice,
no process is deterministic since perfect
knowledge is not known. Now, does it mean

Marathi: 
अतिशय उपयुक्त आहे.
आता, स्पष्टपणे, स्टॉकेस्टिक
म्हणजे नियतकालिकांसाठी
काउंटर भाग आहे, जेथे
आपण असे म्हणता की
डीजीपी अचूकपणे अंदाज
करता येत नाही किंवा
त्याचा ज्ञात नाही
किंवा आपण म्हणू
शकतो की डेटामध्ये
अनिश्चितता आहे आणि
याप्रमाणे.
आणि मी सांगितल्याप्रमाणे,
सराव मध्ये, परिपूर्ण
ज्ञान ज्ञात नसल्यामुळे
कोणतीही प्रक्रिया
निर्णायक नाही. आता
याचा अर्थ असा होतो
की प्रत्येक डेटा
निर्मिती प्रक्रियेस
स्टॉकेस्टिक मानले
गेले पाहिजे?
खरोखरच नाही. निश्चितीधारक
आणि स्टोचॅस्टिक
प्रक्रियेमध्ये
अद्यापही काही फरक
आहे, अगदी सरावाने
जरी काही प्रक्रिया
पूर्णतः अंदाज लावण्यायोग्य
नसली तरीही.
थोडक्यात, आम्ही
म्हणतो की एक प्रक्रिया
प्रामुख्याने नियतशास्त्रीय
किंवा प्रामुख्याने
स्टोचिस्टिक आहे
आणि आपण लवकरच त्यावर
चर्चा करू; या स्लाईडच्या
थोड्या वेळानंतर
लगेच.
तर मग आम्ही यापूर्वी
जे प्रश्न उपस्थित
केले होते त्याकडे
परत जायचो - मला डिटेक्टिन्टीक
किंवा स्टॉकेस्टिक
प्रक्रियेतून डेटा
कसा आला याबद्दल
काळजी का करावी?

Marathi: 
ही धारणा इतकी महत्त्वाची
का आहे?
आता, उत्तर मी पूर्वी
सांगितले आहे असे
काहीतरी आहे - त्या
सिद्धांतामुळे, विश्लेषणासाठीचे
साधन आणि परिणामांचे
अर्थ लावणे या गृहितकांवर
अवलंबून आहेत. आणि
बरेच काही, अनेक उदाहरण
देऊ शकतात.
उदाहरणार्थ, जर मी
ठराविक कालावधी तपासणीस
शोधत आहे, तर आधी मला
परिभाषित करावे लागेल
की नियतकालिक नियतकालिक
सिग्नल काय आहे. जर
मी डिटरमिनिस्टिक
डेटा पहात आहे, आणि
जर मी स्टॉकेस्टिक
डेटा बघत आहे, तर मला
निश्चित करणे आवश्यक
आहे की आवर्ती यादृच्छिक
प्रक्रिया म्हणजे
काय. तर, व्याख्या
वेगवेगळी असते, आणि
म्हणूनच बरोबर, अर्थ
लावणे देखील बदलतील.
त्याचप्रमाणे, जेव्हा
मी स्टॉकेस्टिक सिग्नलच्या
सरासरीचा उल्लेख
करीत असतो तेव्हा
साधारणपणे गैरसमज
म्हणजे नमुन्याचा
अर्थ. हाच अर्थ निरिक्षणांकडून
गणना केलेला असतो,
प्रक्रियाचा अर्थ
समजला जातो; म्हणजे,
हे खरेच नाही. नमुना
म्हणजे वास्तविक
अर्थाचा केवळ अंदाज
आहे जो वेगळ्या पद्धतीने

Tamil: 
என்று புரிந்து கொள்ள
வேண்டும், ஆனால்
அது உண்மையில் டேட்டா
(Data) உந்துதல் செயல்முறை,
பகுப்பாய்வு செயல்முறை
ஒரு மிக மிக முக்கியமான
கலை நடவடிக்கைகள்
மற்றும் பல; நான்
முன்னர் குறிப்பிட்டது
போல், இங்கு நான்
செயல்படுகிறேன்
என்று சொல்லும்போது,
​​அது மிகவும் பொதுவானது.
இந்த அனைத்து, நிச்சயமாக,
டொமைன் (Domain) அறிவு
மிகவும் முக்கியம்
நான் இங்கே முன்னிலைப்படுத்த,
மற்றும் நாம் ஒரு
திட்டத்தை திரும்ப
போது ஒரு பிட் (bit)
பின்னர் பேசுவோம்

Kannada: 
ಆದ್ದರಿಂದ, ನೀವು ಡಾಕ್ಟರ್
ಅಥವಾ ಎಂಜಿನಿಯರ್ ಆಗಿ
ಅಥವಾ ಆರ್ಥಿಕತಜ್ಞರಾಗಿ
ಡೇಟಾವನ್ನು ನೋಡಿದ್ದೀರಿ
ಮತ್ತು ನೀವು ಮಾರುಕಟ್ಟೆ
ಡೇಟಾವನ್ನು ನೋಡಿದ್ದೀರಿ,
ಮತ್ತು ಇದ್ದಕ್ಕಿದ್ದಂತೆ
ಒಂದು ಕುಸಿತ ಕಂಡುಬಂದಿದೆ,
ಮತ್ತು ನೀವು ಚೆನ್ನಾಗಿ
ಕೇಳುತ್ತಿದ್ದಾರೆ
- ಏಕೆ ಈ ಕುಸಿತ ಸಂಭವಿಸಿದೆ
ಅಥವಾ ಏಕೆ ಮಾಡಿದೆ
ಒಂದು ನಿರ್ದಿಷ್ಟ ದೋಷವು
ಒಂದು ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ
ಸಂಭವಿಸುತ್ತದೆ ಮತ್ತು
ಹೀಗೆ. ತದನಂತರ, ನೀವು
ಖಂಡಿತವಾಗಿಯೂ ಇದನ್ನು
ತಡೆಗಟ್ಟುವ ಬಗ್ಗೆ
ಸಲಹೆ ನೀಡುತ್ತೀರಿ.
ಆದ್ದರಿಂದ, ರೋಗನಿರ್ಣಯದ
ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ತೊಡಗಿಸಿಕೊಂಡಿರುವ
ಒಂದು ರೋಗನಿರ್ಣಯ ಮತ್ತು
ನಿವಾರಣೆ ವಿಷಯವಾಗಿರಬಹುದು.
ಆದ್ದರಿಂದ, ನಿಸ್ಸಂಶಯವಾಗಿ,
ವಿವಿಧ ವಿಶ್ಲೇಷಣೆಯ
ವಿವಿಧ ಹೋಸ್ಟ್ಗಳು
ಒಳಗೊಂಡಿವೆ ಮತ್ತು

English: 
that every data generating process has to
be treated as stochastic? Not really. There
is a certain distinction still observed between
deterministic and stochastic processes, even
in practice even though no process is perfectly
predictable. Typically, we say that a process
is predominantly deterministic or predominantly
stochastic and we will talk about it very
soon; soon after this slide here.
So, going back to the question that we raised
earlier - why should I worry about whether
data has come from a deterministic or a stochastic
process? Why is this assumption so important?
Now, the answer is something that I have said
earlier - that theory, the tool for analysis,
and the interpretations of the results significantly
depend on these assumptions. And there are
many, many examples that one can give. For
example, if I am looking at periodicity detection,

Bengali: 
ফল্ট সনাক্তকরণের
জন্য বাহিত করা আছে।
আমি আগেই বলেছি যে,
একজন ডাক্তার, যখন
ডাক্তার ইসিজি দেখেন,
অ্যানোমালিগুলি
খুঁজছেন বা যখন একজন
রেডিওলজিস্ট এক্স-রে
দেখছেন, তখন কিছু
মডেল বা স্বাভাবিক
অবস্থার কোন টেমপ্লেটের
উপর ভিত্তি করে অ্যানোমালিজি
খুঁজছেন, প্রজেক্টিং
রাখে স্বাভাবিক টেমপ্লেট
থেকে বর্তমান তথ্য।

Gujarati: 
જાણવા માટે છે; પરંતુ,
અલબત્ત, તે એકમાત્ર
હેતુ નથી. જેમ મેં
અહીં સૂચિબદ્ધ કર્યા

Hindi: 
कि मैंने कहा, व्यावहारिक
रूप से, कोई प्रक्रिया
निर्धारित नहीं है
क्योंकि सही ज्ञान
ज्ञात नहीं है।
अब, क्या इसका मतलब
यह है कि प्रत्येक
डेटा जनरेटिंग प्रक्रिया
को स्टोकास्टिक के
रूप में माना जाना
चाहिए?
ज़रुरी नहीं।
निश्चित रूप से अनुमानित
और स्टोकास्टिक प्रक्रियाओं
के बीच एक निश्चित
भेद अभी भी देखा गया
है, भले ही कोई प्रक्रिया
पूरी तरह से अनुमानित
न हो।
आम तौर पर, हम कहते
हैं कि एक प्रक्रिया
मुख्य रूप से निर्धारक
या मुख्य रूप से स्टोकास्टिक
है और हम इसके बारे
में जल्द ही बात करेंगे;
इस स्लाइड के तुरंत
बाद।
तो, हम पहले उठाए गए
प्रश्न पर वापस जा
रहे हैं - मुझे इस
बारे में चिंता क्यों
करनी चाहिए कि डेटा
निर्धारिती या स्टोकास्टिक
प्रक्रिया से आया
है या नहीं?
यह धारणा इतनी महत्वपूर्ण
क्यों है?
अब, जवाब कुछ ऐसा है
जो मैंने पहले कहा
था - वह सिद्धांत,
विश्लेषण के लिए
उपकरण, और परिणामों
की व्याख्या इन धारणाओं
पर महत्वपूर्ण रूप
से निर्भर करती है।
और ऐसे कई उदाहरण
हैं जो कोई दे सकते

Malayalam: 
ഒരു തീരുമാനവും നിശ്ചയമില്ല.
ഇപ്പോള്‍, എല്ലാ
ഡാറ്റയും ഉല്പാദിപ്പിക്കുന്നത്
stochasticആയി കണക്കാക്കണമെന്നാണോ?
ശരിക്കുമല്ല.
deterministic ഉം stochastic ഉം ആയതുമായ
പ്രക്രിയകള്‍ക്കിടയില്‍
ഒരു വ്യത്യാസം ഇപ്പോഴും
കാണാവുന്നതാണ്.
പ്രായോഗികമായി പോലും
ഒരു പ്രക്രിയയും
കൃത്യമായി പ്രവചിക്കാനാവില്ല.
സാധാരണഗതിയില്‍,
ഒരു പ്രോസസ്സ് പ്രധാനമായും
deterministic ആണ്. അല്ലെങ്കില്‍
stochastic ആയി നിലനില്‍ക്കുന്നതാണെന്ന്
ഞങ്ങള്‍ പറയുന്നു.
ഈ സ്ലൈഡിന് ശേഷം
ഉടന്‍തന്നെ അതിനെപ്പറ്റി
പറയാം.
അതിനാല്‍, ഞങ്ങള്‍
മുമ്പ് ഉയര്‍ത്തിയ
ചോദ്യത്തിലേക്ക്
തിരിച്ചുപോവുകയാണ്
- deterministic അല്ലെങ്കില്‍
stochastic പ്രക്രിയയില്‍
നിന്നുള്ള ഡാറ്റ
ആണോ എന്ന് നാം ആശങ്കപ്പെടേണ്ടത്
എന്തുകൊണ്ടാണ്?
ഈ അനുമാനം വളരെ പ്രധാനമായിരിക്കുന്നത്
എന്തുകൊണ്ട്?
ഇപ്പോള്‍ ഉത്തരം
പറയാം.
ഞാന്‍ നേരത്തെ പറഞ്ഞിട്ടുണ്ട്
- സിദ്ധാന്തം, വിശകലനത്തിനുള്ള
ഉപകരണം, ഫലങ്ങളുടെ
വ്യാഖ്യാനങ്ങള്‍
എന്നിവയൊക്കെ ഗണ്യമായി
ഈ അനുമാനങ്ങളെ ആശ്രയിച്ചിരിക്കുന്നു.
അനേകം ഉദാഹരണങ്ങള്‍
നല്‍കാന്‍ കഴിയുന്ന
നിരവധി കാര്യങ്ങളുണ്ട്.
ഉദാഹരണത്തിന് ഞാന്‍
periodicity കണ്ടെത്താന്‍

Hindi: 
हैं।
उदाहरण के लिए, यदि
मैं आवधिकता का पता
लगाने पर विचार कर
रहा हूं, तो पहले मुझे
परिभाषित करना होगा
कि आवधिक निर्धारक
संकेत क्या है।
अगर मैं निर्धारिती
डेटा देख रहा हूं,
और यदि मैं स्टोकास्टिक
डेटा देख रहा हूं,
तो मुझे आवधिक यादृच्छिक
प्रक्रिया के साथ
क्या परिभाषित करना
है।
इसलिए, परिभाषाएं
अलग-अलग होती हैं,
और इसलिए सही, व्याख्या
भी बदलेगी।
इसी तरह, जब मैं एक
स्टोकास्टिक सिग्नल
के औसत का जिक्र कर
रहा हूं, आम तौर पर
गलत धारणा नमूना
माध्य है, जिसका मतलब
अवलोकन से गणना की
गई है, इसे प्रक्रिया
का मतलब माना जाता
है; यही है, यह बिल्कुल
सही नहीं है।
नमूना मतलब केवल
वास्तविक अर्थ का
एक अनुमान है जिसे
एक अलग तरीके से परिभाषित
किया गया है और हम
इसके बारे में जल्दी
से बात करेंगे।
तो, यहां की निचली
पंक्ति है, चाहे आप
औसत रूपों या सिग्नल
की किसी भी अन्य विशेषता
को देख रहे हों, आपको
वास्तव में किताबों
पर वापस जाना होगा
और पूछें कि सिग्नल

Marathi: 
परिभाषित केला जातो
आणि आम्ही त्यावर
त्वरित चर्चा करू.
तर, येथे तळ ओळ आहे,
आपण मध्यवर्ती रूपे
पाहत आहात किंवा
सिग्नलचा इतर वैशिष्ट्यपूर्ण
आहात, तरी तुम्हाला
खरंतर पुस्तके परत
मिळवावी लागेल आणि
मी विचारत असलेल्या
सिग्नलसाठी हे कसे
ठरवले जातात ते विचारा.
जर मी डिटेक्टिन्निस्ट
सिग्नलकडे पहात आहे
- ठराविक कालावधीची
व्याख्या काय आहे?
अर्थ म्हणजे काय?
जर मी स्टॉकेस्टिक
सिग्नलकडे पहात आहे
- ही व्याख्या काय
आहे?
आणि मग केवळ, आपण अर्थपूर्ण
व्याख्या करू शकता.
आणि अतिशय सामान्य
स्थिती अशी आहे की
वीज-स्पेक्ट्रल घनता
जी नियमित कालावधीच्या
शोधासाठी वापरली
जाते आणि इत्यादी.
असं असलं तरी, आपण
इतक्या तपशीलाने
जाणार नाही, परंतु
हे सत्य आपण लक्षात
ठेवावे आणि प्रत्येक
वेळी आपण डेटा गोळा
कराल आणि आपण काही
विशिष्ट महत्त्वपूर्ण
प्रश्न विचारण्यासाठी
डेटाचे विश्लेषण

Gujarati: 
છે, ત્યાં ડેટા એનાલિસિસ(data
analysis)ના ઘણા હેતુઓ
છે. તે commomly હોઈ શકે
છે. સામાન્ય હેતુઓ,

Kannada: 
ನಾನು ಪಟ್ಟಿ ಮಾಡದಿರುವ
ಅನೇಕ ಇತರ ವರ್ಗೀಕರಣಗಳಿವೆ.
ವಿಶಿಷ್ಟವಾಗಿ, ಉತ್ತಮ
ಆರಂಭಿಕ ಅಂಶಗಳು ಪರಿಶೋಧನಾತ್ಮಕ
ಮತ್ತು ವಿವರಣಾತ್ಮಕ
ವಿಶ್ಲೇಷಣೆ ಮತ್ತು
ನಂತರ ಅಲ್ಲಿಂದ ಒಂದು
ಆದಾಯವನ್ನು ಪಡೆಯುತ್ತದೆ;
ನೀವು ಮುನ್ಸೂಚನೆಗೆ
ಒಂದು ಮಾದರಿಯನ್ನು
ನಿರ್ಮಿಸಲು ನೀವು ನಿರ್ಧರಿಸಿದ್ದೀರಾ
ಸಹ, ನೀವು ಡೇಟಾವನ್ನು
ಎಕ್ಸ್ಪ್ಲೋರ್ ಮಾಡುವಂತೆ,
ಡೇಟಾವನ್ನು ನೀವು ಸ್ನೇಹಿತರನ್ನಾಗಿ
ಮಾಡಲು ಮತ್ತು ಡೇಟಾವನ್ನು
ನೀವೇ ಪರಿಚಿತರಾಗಿರುವಿರಿ,
ನೀವು ಮಾದರಿಯನ್ನು
ಬೆಳೆಸುವ ಮುನ್ನ , ಉದಾಹರಣೆಗೆ.
ಈಗ, ಸಾಮಾನ್ಯವಾಗಿ,
ವಿಶ್ಲೇಷಣೆಯ ಉದ್ದೇಶ
ನಾವು ಇಲ್ಲಿ ಪಟ್ಟಿ
ಮಾಡಲಾದ ನಿರ್ದಿಷ್ಟ
ರೀತಿಯ ವಿಶ್ಲೇಷಣೆಯನ್ನು
ನಿರ್ಧರಿಸುತ್ತದೆ,
ಅದು ನೀವು ಕೈಗೊಳ್ಳುತ್ತದೆ.
ಅಂದರೆ, ಒಂದು ವಿಶ್ಲೇಷಣೆಯ
ಕೊನೆಯ ಬಳಕೆಯನ್ನು
ಮುಖ್ಯವಾಗಿ, ನೀವು
ಹೊರತೆಗೆಯುವ ಮಾಹಿತಿಯನ್ನು

Tamil: 
மற்றும் டேட்டா அனாலிசிஸ்
(Data Analysis) தொடர்பு என்று
முறையான நடைமுறை
விவாதிக்க போது.
எனவே, வட்டம், டேட்டா
அனாலிசிஸ் (Data Analysis)
என்ன பொருந்துகிறது
என்பதை நீங்கள் புரிந்துகொள்கிறீர்கள்.
இது உண்மையில் கவனிப்பு
உலகத்துடன் தகவல்
உலகை இணைக்கிறது.
பல்வேறு அனாலிசிஸ்
(Analysis)கள் உள்ளன, இப்போது,
​​உங்கள் பகுப்பாய்வு
தேவை மற்றும் இறுதி
பயன்பாட்டை பொறுத்து,
இப்போது, ​​நீங்கள்
இலக்கியத்தில் காணலாம்
பல வகைப்பாடுகள்
உள்ளன.
நான் இங்கு பட்டியலிடப்பட்டுள்ள
விஷயம் என்னவென்றால்
முழுமையான அர்த்தம்
இல்லை.

English: 
then first I have to define what is a periodic
deterministic signal is. If I am looking at
deterministic data, and if I am looking at
stochastic data, then I have to define what
is meant by periodic random process. So, the
definitions vary, and therefore right, the
interpretations will also change. Likewise,
when I am referring to the average of a stochastic
signal, normally misconception is the sample
mean, which is the mean that is computed from
observations, is considered as the mean of
the process itself; that is, it is not true
at all. The sample mean is only an estimate
of the true mean which is defined in a different
way and we will quickly talk about it.
So, the bottom line here is, whether you are
looking at mean variants or any other characteristic
of the signal, you have to really go back
to the books and ask how are these defined
for the signal that I am looking at. If I

Malayalam: 
നോക്കിയാല്‍ ആദ്യം
ഒരു പീരിയോഡിക് deterministic
സിഗ്നല്‍ എന്താണ്
എന്ന് നിര്‍വ്വചിക്കേണ്ടതുണ്ട്.
ഞാന്‍ deterministic ഡാറ്റയെ
നോക്കുകയാണെങ്കില്‍
stochastic ഡാറ്റ നോക്കിയാല്‍,
ആവര്‍ത്തന ക്രമരഹിത
പ്രക്രിയയുടെ അര്‍ത്ഥം
എന്താണ് എന്ന് നിര്‍വ്വചിക്കേണ്ടതുണ്ട്.
അതുകൊണ്ട്, നിര്‍വ്വചനങ്ങള്‍
വ്യത്യാസപ്പെടുന്നു.
അതിനാല്‍ ശരിയായ
വ്യാഖ്യാനങ്ങളും
മാറുന്നു.
അതുപോലെ, ഞാന്‍ ഒരു
stochastic സിഗ്നലിന്‍റെ
ശരാശരിയെ സൂചിപ്പിക്കുമ്പോള്‍,
സാധാരണ തെറ്റിദ്ധാരണയുണ്ടാകുന്നത്
സാമ്പിള്‍ mean ലാണ്.
ഇത് അര്‍ത്ഥമാക്കുന്നത്
, നിരീക്ഷണങ്ങളില്‍
നിന്നുമുള്ള കണക്ക്
മാത്രമാണ്.
പ്രോസസിന്‍റെ ശരാശരിയായി
ഇത് കണക്കാക്കപ്പെടുന്നു.
അതായത്, അത് സത്യമല്ല.
വേറൊരു രീതിയില്‍
നിര്‍വ്വചിച്ചിരിക്കുന്ന
sample mean എന്നാല്‍ true
mean കണക്കാക്കുന്നതാണ്.
അത് വേഗത്തില്‍ നിങ്ങള്‍
സംസാരിക്കും.
ഇവിടെ, താഴത്തെ വരിയില്‍
നിങ്ങള്‍ അര്‍ത്ഥമാക്കുന്നത്
നിങ്ങള്‍ mean variants നോക്കുകയോ
സിഗ്നലിന്‍റെ മറ്റേതെങ്കിലും
സ്വഭാവം നോക്കുകയോ
ആണെങ്കിലും നിങ്ങള്‍
യഥാര്‍ത്ഥത്തില്‍
പുസ്തകങ്ങളിലേക്ക്
തിരികെ പോയി നാം
deterministic സിഗ്നല്‍ പരിശോധിക്കുകയാണെങ്കില്‍
- periodicity നിര്‍വ്വചനം
എന്താണ്?
ശരാശരിയുടെ നിര്‍വ്വചനം
എന്താണ്?

Bengali: 
এবং যে সাধারণত ভুল
সনাক্তকরণ সর্বত্র
সঞ্চালিত হয় কিভাবে
হয়; এমনকি প্রক্রিয়া
শিল্প যে অবস্থা
হয়।
সুতরাং, এটি প্রক্রিয়া
পর্যবেক্ষণ হিসাবে
পরিচিত হয়।
এবং এমন কিছু উদ্দেশ্য
রয়েছে যা একটি তথ্য
বিশ্লেষণে তালিকাভুক্ত
করতে পারে, তবে এটি
মূলত ডেটা বিশ্লেষণের
বেশিরভাগ অংশ জুড়েছে।

Tamil: 
நீங்கள் பார்க்கும்
அனாலிசிஸ் (Data Analysis)ன்
பொதுவான வகைப்பாடுகளில்
ஒன்று, ரிசெர்ச்
ஜௌர்னல்ஸ் (research journal)ளை
உறுதிப்படுத்துகிறது.
அனாலிசிஸ் (Analysis) வகை
பகுப்பாய்வில், நீங்கள்
வெளிப்படையான எதையும்
முன்வைக்க வேண்டாம்,
ஆனால் நீங்கள் தரவை
ஆய்வு செய்து உங்கள்
செயல்முறையை புரிந்துகொள்ள
முயற்சிக்கிறீர்கள்.
உதாரணமாக, அது சராசரியான
அல்லது நிலையான விலகல்
அல்லது வரைபடங்களைப்
பார்த்து, செயல்முறை
நேரியல் அல்லது எழுதுபொருள்
மற்றும் பலவகை என்பதை
புரிந்துகொள்ள முயற்சி
செய்யலாம்; செயல்முறை
ஊசலாட்டமாக இருக்கிறதா
எனத் தீர்மானிக்க
முயல்கிறது.

Bengali: 
আপনি দেখতে পারেন
অ্যাপ্লিকেশন বেশ
বৈচিত্রময় এবং বৈচিত্রময়।
অতএব, যে পদ্ধতি আমরা
একটি বিশ্লেষণের
জন্য অনুসরণ করি,
যে সরঞ্জামগুলি আমরা
স্থাপন করি এবং যে
ব্যাখ্যাগুলি আমরা
আঁকছি সেগুলি অবশ্যই
বিস্তৃতভাবে পরিবর্তিত
হয়।
সুতরাং, ডাটা বিশ্লেষণের
দিকে নজর দেওয়া
এবং তথ্যভিত্তিক
বিশ্লেষণের বিস্তৃত

Gujarati: 
ઉદાહરણ તરીકે, પેરામીટર(parameter)
અંદાજ જ્યાં અમે
અમુક અજાણ્યોની માહિતી
આપી રહ્યા છીએ, અને
જ્યારે હું પરિમાણો
અહીં કહું છું, તે

Marathi: 
करू शकाल, आणि त्यातील
एक प्रश्न आहे - मी
कोणत्या गृहीतकाबद्दल
बोलत आहे डेटा निर्मिती
प्रक्रिया.
तर मग, डेटा अॅलॅलिसिसमध्ये
विशेषत: अनुसरण केलेली
प्रक्रिया काय आहे
हे शिकण्याआधी, या
प्रश्नावर डीक्टिनेस्टिक
किंवा स्टोचॅस्टिकवर
चर्चा बंद करणे चांगले
आहे - आम्ही डीजीपीला
कधी समजतो निर्धारक
किंवा स्टॉकेस्टिक
असावा का?
का कोणी येतो आणि
मला सांगते का?
स्पष्टपणे नाही.
मला साहित्य सापडेल
का?
काही वेळा होय, पण
मी पाहत असलेल्या
प्रक्रियेसाठी बहुतेक
वेळा नाही. तर, एक
प्राथमिकता जाणून
घेण्याचा एक मार्ग
आहे का?
ठीक आहे, दुर्दैवाने,
आपल्यासाठी एक निर्धारक
किंवा स्टॉकेस्टिक
प्रक्रियेतून डेटा
येत आहे की नाही हे
स्पष्ट करण्यासाठी
कोणतेही परिपूर्ण
सूत्र नाही; परंतु
आपण बरोबर ओळखत नाही
ते आपल्याला किती
माहित आहे हे पाहणे
आवश्यक आहे. त्या
प्रक्रियेबद्दल
आहे तर, उदाहरणार्थ,
मी बॉल धरतोय, खोलीत,
जिथे जास्त ब्रीझ

Hindi: 
के लिए ये कैसे परिभाषित
किए गए हैं।
अगर मैं एक निर्धारक
संकेत देख रहा हूं
- आवधिकता की परिभाषा
क्या है?
मतलब की परिभाषा
क्या है?
अगर मैं एक स्टोकास्टिक
सिग्नल देख रहा हूं
- परिभाषा क्या है?
और फिर केवल, आप सार्थक
व्याख्या कर सकते
हैं।
और एक बहुत ही सामान्य
स्थिति बिजली वर्णक्रमीय
घनत्व का है जो आवधिकता
का पता लगाने के लिए
उपयोग की जाती है
और इसी तरह।
वैसे भी, हम विस्तार
से इतना नहीं जाएंगे,
लेकिन आपको इस तथ्य
को याद रखना चाहिए,
और हर बार जब आप डेटा
एकत्र करते हैं और
आप बैठते हैं तो कुछ
महत्वपूर्ण प्रश्न
पूछने के लिए डेटा
का विश्लेषण करते
हैं, और उनमें से एक
प्रश्न यह है कि मैं
किस बारे में अनुमान
लगा रहा हूं डेटा
जनरेटिंग प्रक्रिया।
इसलिए, सीखने के लिए
आगे बढ़ने से पहले
एक प्रक्रिया है
जो आम तौर पर डेटा
विश्लेषण (DATA ANALYSIS)में
होती है, इस सवाल के
साथ निर्धारिती या
स्टोकास्टिक पर इस
चर्चा को बंद करना
अच्छा होता है - जब

Kannada: 
ನೀವು ಹೇಗೆ ಬಳಸುತ್ತೀರಿ.
ಮತ್ತು ನಾವು ಡೇಟಾ
ವಿಶ್ಲೇಷಣೆಗೆ ಹೋಗುವ
ಮುನ್ನ, ಲಭ್ಯವಿರುವ
ವಿಭಿನ್ನ ರೀತಿಯ ಡೇಟಾ
ಯಾವುದು ಎಂಬುದನ್ನು
ತಿಳಿದುಕೊಳ್ಳಲು ಬಹಳ
ಉಪಯುಕ್ತವಾಗಬಹುದು,
ಏಕೆಂದರೆ ಮುಖ್ಯವಾಗಿ
ನಾನು ನಂತರ ಸೂಚಿಸುವಂತೆ,
ಉಪಕರಣಗಳು, ವ್ಯಾಖ್ಯಾನಗಳು,
ಮತ್ತು ಹಲವು ಇತರ ಹಂತಗಳು
ಡೇಟಾದ ಸ್ವರೂಪವನ್ನು
ಅವಲಂಬಿಸಿವೆ.
ಈಗ, ಮತ್ತೊಮ್ಮೆ, ನೀವು
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಸಾಹಿತ್ಯಕ್ಕೆ
ತಿರುಗಿದಾಗ, ನೀವು
ವಿವಿಧ ರೀತಿಯ ವರ್ಗೀಕರಣವನ್ನು
ಕಾಣಬಹುದು, ಹಲವಾರು
ವರ್ಗೀಕರಣಗಳು ಅಸ್ತಿತ್ವದಲ್ಲಿವೆ.
ಉದಾಹರಣೆಗೆ, ನೀವು
ಸಂಖ್ಯಾ ಪದ್ಯಗಳನ್ನು
ವರ್ಗೀಯ ವರ್ಗೀಕರಣ
ಅಥವಾ ಸ್ಥಿರವಾದ ರಾಜ್ಯ
ಪದ್ಯಗಳನ್ನು ಕ್ರಿಯಾತ್ಮಕ
ಮತ್ತು ಇನ್ನೂ ಕಾಣಬಹುದು,
ಆದರೆ ನಾನು ಆ ಬಗ್ಗೆ
ನಿಜವಾಗಿಯೂ ಮಾತನಾಡಲು

Malayalam: 
ഞാന്‍ ഒരു stochastic സിഗ്നല്‍
നോക്കിയാല്‍ - എന്താണ്
അതിന്‍റെ നിര്‍വ്വചനം?
അപ്പോള്‍ മാത്രമേ
നിങ്ങള്‍ക്ക് അര്‍ത്ഥവത്തായ
വ്യാഖ്യാനങ്ങള്‍
നല്‍കാന്‍ കഴിയൂ.
വളരെ സാധാരണമായ അവസ്ഥയാണ്
periodicity കണ്ടെത്തുന്നതിനുപയോഗിക്കുന്ന
വൈദ്യുത സ്പെക്ട്രല്‍
സാന്ദ്രത.
എന്തായാലും, ഞങ്ങള്‍
വളരെ വിശദമായി പോകില്ല.
പക്ഷേ നിങ്ങള്‍ ഈ
വസ്തുത ഓര്‍മ്മിക്കേണ്ടതാണ്.
എല്ലാ സമയത്തും നിങ്ങള്‍
ഡാറ്റ ശേഖരിക്കുകയും,
നിങ്ങള്‍ പ്രധാനപ്പെട്ട
ചില ചോദ്യങ്ങള്‍
ചോദിക്കാന്‍ ഡാറ്റ
വിശകലനം ചെയ്യുകയുമാണെങ്കില്‍
ആ ചോദ്യങ്ങളില്‍
ഒന്നാണ് ഡാറ്റ സൃഷ്ടിക്കുന്ന
പ്രക്രിയ.
സാധാരണയായി ഡാറ്റ
വിശകലനത്തിന് വിധേയമായിരിക്കുന്ന
ഒരു പ്രക്രിയ എന്താണ്
പഠിക്കുന്നതെന്ന്
മുന്‍കൂട്ടി തീരുമാനിക്കുന്നതിന്
മുമ്പ്തന്നെ, ഈ ചര്‍ച്ചയില്‍
deterministic അല്ലെങ്കില്‍
stochastic കുറിച്ച് പറയുന്നത്
നല്ലതാണ്.
എപ്പോഴാണ് DGP deterministic
അല്ലെങ്കില്‍ stochastic
എന്ന് അനുമാനിക്കുക.
ഒരാള്‍ വന്ന് നമ്മളോട്
പറയുമോ?
തീര്‍ച്ചയായും അല്ല.
സാഹിത്യത്തില്‍

English: 
am looking at a deterministic signal - what
is the definition of periodicity? What’s
the definition of mean? If I am looking at
a stochastic signal - what is the definition?
And then only, you can make meaningful interpretations.
And a very, very common situation is that
of power spectral density which is used for
periodicity detection and so on. Anyway, we
will not go so much in detail, but you should
remember this fact, and every time you collect
data and you sit do analyse data to ask certain
important questions, and one of those questions
is - what assumptions am I making about the
data generating process.
So, before we move on to learning what is
a procedure that’s typically followed in
data analysis, it’s again good to close
this discussion on deterministic or stochastic
with this question - when do we assume the
DGP to be deterministic or stochastic? Does
some one comes and tell me that? Obviously
not. Can I find in the literature? Some times

Kannada: 
ಹೋಗುತ್ತಿಲ್ಲ, ಆದರೆ
ಜನರು ಸಾಮಾನ್ಯವಾಗಿ
ಕನಿಷ್ಠ ನಿರ್ಲಕ್ಷಿಸಿರುವ
ಮುಖ್ಯವಾದವುಗಳಲ್ಲಿ
ದತ್ತಾಂಶ ವಿಶ್ಲೇಷಣೆಯು
ನಿರ್ಲಕ್ಷ್ಯದ ಅಥವಾ
ಸಂಭವನೀಯ ದತ್ತಾಂಶಗಳ
ನಿರ್ಣಾಯಕ ಪದ್ಯಗಳ
ಈ ವರ್ಗೀಕರಣವನ್ನು
ನಿರ್ಲಕ್ಷಿಸುತ್ತದೆ.
ಅದು ಬಹಳ ಮುಖ್ಯವಾಗಿದೆ
ಏಕೆಂದರೆ ಸೈದ್ಧಾಂತಿಕವಾಗಿ
ಸ್ವತಃ ಅಥವಾ ಸಿದ್ಧಾಂತವು
ಒಂದು ನಿರ್ದಿಷ್ಟವಾದ
ಪದ್ಯಗಳನ್ನು ಸಂಭವನೀಯ
ಪ್ರಕ್ರಿಯೆಯಿಂದ ಹೊರಬಂದಿದೆ
ಎಂದು ನೀವು ಹೇಳುವ
ಕ್ಷಣದಲ್ಲಿ ಭಿನ್ನವಾಗಿರುತ್ತವೆ.
ಈಗ, ಕೆಲವು ಜನರು ಯಾದೃಚ್ಛಿಕ
ಪದವನ್ನು ಬಳಸುತ್ತಾರೆ.
ಯಾದೃಚ್ಛಿಕ ಮತ್ತು
ಸಂಭವನೀಯತೆಯ ನಡುವಿನ
ಸೂಟ್ ವ್ಯತ್ಯಾಸವಿದೆ;
ಹೇಗಾದರೂ, ನಾವು ಇಲ್ಲಿ
ವ್ಯತ್ಯಾಸವನ್ನು ಗಮನಿಸುವುದಿಲ್ಲ.
ಕೆಲವೊಮ್ಮೆ, ನಿರ್ಣಾಯಕವಾದ
ಪದವನ್ನು ಬಳಸಲಾಗುತ್ತದೆ.
ಈ ವರ್ಗೀಕರಣ ಅಥವಾ
ವೈಲಕ್ಷಣ್ಯವು ಏಕೆ
ಮುಖ್ಯವಾದುದು ಎಂದು
ನಾವು ಕೇಳುವ ಮೊದಲು,

Hindi: 
हम डीजीपी को कब मानते
हैं निर्धारक या
stochastic हो?
क्या कोई आता है और
मुझे बताता है?
बेशक नहीं।
क्या मैं साहित्य
में पा सकता हूं?
कुछ हां हां, लेकिन
अधिकांश बार उस प्रक्रिया
के लिए नहीं जो मैं
देख रहा हूं।
तो, क्या प्राथमिकता
जानने का कोई तरीका
है?
खैर, दुर्भाग्य से,
यह पता लगाने के लिए
कोई सही सूत्र नहीं
है कि डेटा निर्धारिती
या स्टोकास्टिक प्रक्रिया
से बाहर आ रहा है या
नहीं; लेकिन आपको
यह जानना होगा कि
आप कितना सही नहीं
जानते हैं।
यह प्रक्रिया के
बारे में है।
तो, एक उदाहरण के रूप
में, मान लीजिए कि
मैं एक कमरे में एक
गेंद पकड़ता हूं,
जहां बहुत अधिक हवा
नहीं होती है।
हवा काफी अभी भी है
और मैं गेंद को छोड़ने
जा रहा हूं।
हम भौतिकी की मदद
से काफी अधिक कर सकते
हैं कि गेंद कितनी
देर तक फर्श पर हिट
करती है।
यह काफी निर्धारक
प्रक्रिया है।
वहां इतनी अनिश्चितता
नहीं है।
दूसरी तरफ, अगर मुझसे
पूछा जाए कि क्या

Malayalam: 
എനിക്ക് അത് കാണാന്‍
കഴിയുമോ?
ചില തവണ ശരിയാകും.
പക്ഷേ മിക്ക സമയത്തും
ഞാന്‍ നോക്കുന്ന
പ്രക്രിയകള്‍ക്കില്ല.
അപ്പോള്‍, അത് അറിയാന്‍
മാര്‍ഗ്ഗം ഉണ്ടോ?
നിര്‍ഭാഗ്യവശാല്‍,
ഡാറ്റ ഒരു deterministic അല്ലെങ്കില്‍
stochastic പ്രക്രിയയില്‍
നിന്നും പുറത്ത്
വരുന്നോ എന്ന് കണ്ടുപിടിക്കാന്‍
നിങ്ങള്‍ക്ക് ഒരു
സൂത്രവാക്യം ഇല്ല.
എന്നാല്‍ ആ പ്രക്രിയയെ
പറ്റി നിങ്ങള്‍ക്കറിയാത്തത്
എത്രത്തോളമെന്നും
നിങ്ങള്‍ക്ക് അറിയാവുന്നത്
എത്രത്തോളമെന്നും
നിങ്ങള്‍ക്കറിയാം.
ഉദാഹരണത്തിന് ഞാന്‍
ഒരു പന്ത് മുറിയില്‍
വെച്ചിരിക്കുന്നു.
വളരെ കുറച്ച് തണുപ്പ്
അവിടെയുള്ളൂ.
വായു എപ്പോഴും അവിടെയുണ്ട്.
ഞാന്‍ പന്ത് ഡ്രോപ്പ്
ചെയ്യാന്‍ പോവുകയാണ്.
ഭൗതികശാസ്ത്രത്തിന്‍റെ
സഹായത്തോടെ നമുക്ക്
പന്ത് തറയെ സ്പര്‍ശിക്കാന്‍
എത്ര ദൂരമാകുമെന്ന്
കണക്കാക്കാം.
ഇത് തികച്ചും നിര്‍ണ്ണായകമായ
ഒരു പ്രക്രിയയാണ്.
അവിടെ അധികം അനിശ്ചിതത്വം
ഇല്ല. മറ്റൊരു വിധത്തില്‍,
നാളെ മഴ പെയ്യാന്‍
പോകുകയാണോ അല്ലെങ്കില്‍

Marathi: 
नाही तिथे. हवा बर्यापैकी
आहे आणि मी बॉल टाकणार
आहे भौतिक शास्त्रज्ञांच्या
मदतीने आपण बरेच
काही सांगू शकतो
की फलंदादीला चेंडू
लावणे किती अवघड
आहे त्या एक निर्धारक
प्रक्रिया आहे. तिथे
खूप अनिश्चितता नाही.
दुसरीकडे, उद्याची
पावसाची स्थिती असेल
किंवा 6 महिने पाऊस
पडेल की नाही हे मला
विचारले असता तर
मी पाऊस पडणार आहे
किंवा मी इतर कोणत्याही
वातावरणातील प्रक्रियेत
किंवा अर्थमिती्रिक
प्रक्रियेवर तसेच
एखाद्या सेन्सरच्या
आवाजावर किंवा इतर
चालू, संवेदनातील
त्रुटीचे पुढील मूल्य
काय आहे याचा अंदाज
करणे कठीण आहे, उदाहरणार्थ.
अशा परिस्थितीमध्ये,
आम्ही संभाव्यतेच्या
सिद्धांतामध्ये
आश्रय घेतो आणि असे
म्हणतो की मला या
प्रक्रियेचे परिपूर्ण
ज्ञान नाही. म्हणून
मी असे गृहीत धरू
देईन की बर्याच शक्यता
आहेत आणि मी त्या
संभाव्य शक्यतांनुसार
संधी देतो, आणि जिथे
संभाव्यता सिद्धांताचा
जन्म होतो आणि तिथेच
वेळ मालिका विश्लेषण
येतो. तिथे आणखी एक

Tamil: 
நிறைய காட்சி மற்றும்
பல விளக்கமான புள்ளியியல்
பகுப்பாய்வு ஈடுபட்டுள்ளது;
உறுதிப்படுத்தல்
பகுப்பாய்வில், நீங்கள்
ஒரு முன்மொழிவு முன்கூட்டியே
இருக்க வேண்டும்,
மேலும் நீங்கள் மனதில்
உள்ளதை சரியாக உள்ளதா
இல்லையா என்பதை உறுதிப்படுத்த
தரவுகளைப் பயன்படுத்துவீர்கள்.
எனவே, வெளிப்படையாக,
அங்கு ஒரு பிட் (bit)
வேறுபாடு உள்ளது.
பின்னர், நீங்கள்
குவான்டிடேட்டிவ்
வெர்சஸ் குவாலிடேடிவ்
டேட்டா அனாலிசிஸ்
(quantitative verses qualitative data analysis)
வேண்டும்.
உதாரணமாக, தரமான
டேட்டா அனாலிசிஸ்
(Data Analysis), நீங்கள் போக்குகளை
பார்க்கிறீர்கள்;
உதாரணமாக, நீங்கள்
சில அம்சங்கள் மற்றும்
அலைவு அம்சங்களை
தேடுகிறீர்கள்.
அதேசமயம், அளவுகோலில்
நீங்கள் இருக்கின்றீர்கள்.
நீங்கள் உங்கள் அனாலிசிஸ்
(Analysis)லிருந்து எண்ணியல்
முடிவுகளைப் பார்க்கிறீர்கள்.
பின்னர், உங்களுக்கு
விளக்கமான விளக்கங்களைக்
கூறும் ஒன்று உள்ளது.
மேலும் விளக்கமளிக்கும்
பகுப்பாய்வில், மீண்டும்,

Bengali: 
স্কিমের মধ্যে এটি
কোথায় উপযুক্ত তা
জিজ্ঞাসা করা প্রয়োজন।
সুতরাং, এখানে এই
ছবিটি উপস্থাপনা
আপনাকে কিছু ধারণা
দিতে চেষ্টা করে
যেখানে বিশ্লেষণের
মধ্যে রয়েছে।
পরিকল্পিত শীর্ষে,
আপনার প্রক্রিয়া
আছে, এবং এই প্রক্রিয়াটি
একটি খুব জেনেরিক
প্রক্রিয়া; এটি
একটি প্রকৌশল প্রক্রিয়া

Gujarati: 
માત્ર મોડેલ પરિમાણો
નથી; આ પરિમાણો આંકડાકીય
ગુણધર્મોને પણ સંદર્ભિત
કરી શકે છે જેને આપણે

English: 
yes, but most of the times no for the process
that I am looking at. So, is there a way to
know a priori? Well, unfortunately, there
is no perfect formula for you to figure out
whether the data is coming out of a deterministic
or stochastic process; but you have to go
by how much you know vis-a-vis how much you
do not know right. That’s about the process.
So, as an example, suppose I hold a ball,
in a room, where there is not much breeze.
The air is fairly still and I am going to
drop the ball. We can pretty much with a help
of physics calculate how long the ball takes
to hit the floor. That’s fairly a deterministic
process. There is not so much uncertainty
there. On the other hand, if I were to be

Hindi: 
कल बारिश हो रही है
या 6 महीने में बारिश
हो रही है या यदि मैं
किसी भी अन्य वायुमंडल
प्रक्रिया की विशेषताओं
या यहां तक ​​कि अर्थशास्त्रीय
प्रक्रिया को देखता
हूं और इसी तरह या
सेंसर शोर और इसलिए
उदाहरण के लिए, सेंसर
में त्रुटि का अगला
मूल्य क्या है, यह
अनुमान लगाने में
बहुत मुश्किल है।
ऐसी परिस्थितियों
में, हम संभावना सिद्धांत
में शरण लेते हैं
और हम कहते हैं कि
देखो कि मेरे पास
प्रक्रिया का सही
ज्ञान नहीं है।
इसलिए, मुझे लगता
है कि कई संभावनाएं
हैं, और मैं उन सभी
संभावनाओं के अवसरों
को आवंटित करता हूं,
और यही वह जगह है जहां
संभाव्यता सिद्धांत
जन्म लेता है, और यही
वह समय है जहां समय
श्रृंखला विश्लेषण
आता है।
एक और स्थिति भी है
जिसमें आपको लगता
है कि आपको प्रक्रिया
को स्टोकास्टिक होना
चाहिए और वह स्थिति
वह जगह है जहां आप
जिस डेटा को देख रहे
हैं उसका कारण अज्ञात
है।
तो, एक साधारण उदाहरण
के रूप में, मान लीजिए,
मैं शेयर बाजार सूचकांक
की भविष्यवाणी देख
रहा हूं।

English: 
asked whether its going to may be rain tomorrow
or in 6 months it’s going to rain or if
I look at any other atmosphere process characteristics
or even econometric process and so on or a
sensor noise and so on, it’s very hard to
predict what is the next value of the error
in the sensor, for example.
In such situations, we take asylum in probability
theory and we say that look I do not have
a perfect knowledge of the process. Therefore,
I shall assume that there are many possibilities,
and I assign chances to each of those possibilities,
and that’s where probability theory takes
birth, and that’s where time series analysis
comes in. There is also another situation
in which you may have to assume the process
to be stochastic and that situation is where
the cause of the data that you are looking
at is unknown. So, as a simple example, suppose,
I am looking at the prediction of stock market
index. There are so many causes that actually
affect; there are so many factors responsible

Gujarati: 
સામાન્ય રીતે રસ
ધરાવીએ છીએ, જેમ કે
સરેરાશ - એટલે કે સરેરાશ,
ચલન, ચલો અથવા પ્રમાણભૂત

Tamil: 
அது சுரண்டல் போன்றது;
அதேசமயத்தில், தகவல்களிடமிருந்து
ஏதாவது ஒரு குறிப்பிட்ட
தகவலைத் தாக்கல்
செய்ய முயற்சிக்கிறீர்கள்,
மேலும் அது கற்பிதக்
பரிசோதனைக்கு உட்படுத்துகிறீர்கள்.
எனவே, அனுமான பகுப்பாய்வை
உள்ளடக்கிய நிறைய
முறைமை, எண், மற்றும்
ஸ்டாடிஸ்டிக்கல்
டேட்டா (statistical analysis)
உள்ளது, இது ஒரு மாதிரியை
உருவாக்கும் போன்ற
பெரிய பகுப்பாய்வின்
பகுதியாக இருக்கலாம்.
அதேசமயம், விரிவான
அனாலிசிஸ் (Analysis) என்பது
ஒரு பெரிய அனாலிசிஸ்
(Analysis)ல் நேரடியாக
பயனளிக்கத் தேவையில்லை;
இது பொதுவாக டேட்டா
அனாலிசிஸ் (Data Analysis)
முதல் படி தான். பின்னர்,
உங்களுக்கு முன்னறிவிக்கப்பட்ட
வசனங்களைக் குறிப்பிட
வேண்டும்.
முன்னறிவிப்பு பகுப்பாய்வு
தரவு அடிப்படையிலான
செயல்முறையைத் தலைகீழாக
கேட்கிறது.
பல பயன்பாடுகளில்
இது மிகவும் பயனுள்ளதாக
இருக்கும்; அதனால்தான்
ஏதாவது நடந்தது ஏன்
என்று கேட்கிறீர்களா?
எனவே, நீங்கள் ஒரு
டாக்டர் (doctor) அல்லது
ஒரு என்ஜினீயர்(Engineer)க
அல்லது ஒரு எகானாமிஸ்ட்(Economist)க
அல்லது நீங்கள் சந்தைத்
தரவைக் கவனித்திருக்கிறீர்கள்,
திடீரென்று ஒரு விபத்து
ஏற்பட்டிருக்கிறது,
நீங்கள் நன்றாக கேட்கிறீர்கள்
- ஏன் இந்த விபத்து
நிகழ்ந்தது அல்லது
ஏன் செய்தது ஒரு
குறிப்பிட்ட தவறு
ஒரு செயல்முறை மற்றும்
அதனால் ஏற்படும்.
பின்னர், நீங்கள்,
நிச்சயமாக, இந்த
தடுக்க எப்படி பரிந்துரைக்க
போகிறோம்?
எனவே, ஒரு அனாலிசிஸ்
(Analysis)மற்றும் சரிசெய்யக்கூடிய
அனாலிசிஸ் (Analysis)ல்
ஈடுபடுத்துகிறது.
எனவே, வெளிப்படையாக,
சம்பந்தப்பட்ட பல்வேறு

Kannada: 
ವ್ಯಾಖ್ಯಾನಗಳನ್ನು
ನೋಡೋಣ ಮತ್ತು ವ್ಯಾಖ್ಯಾನಗಳು
ಡೇಟಾ ಉತ್ಪಾದಿಸುವ
ಪ್ರಕ್ರಿಯೆಯನ್ನು
ಆಧರಿಸಿವೆ.
ಆದ್ದರಿಂದ, ನಿರ್ಣಾಯಕ
ಮತ್ತು ಸಂಭವನೀಯ ಅರ್ಹತೆಗಳು
ಡೇಟಾ ಪ್ರತಿ ಸೆಗೆ
ಅಲ್ಲ, ಇದು ವಾಸ್ತವವಾಗಿ,
ಅವರು ಡೇಟಾವನ್ನು ಉತ್ಪಾದಿಸುವ
ಪ್ರಕ್ರಿಯೆಗೆ ಅರ್ಹತೆ
ಪಡೆದಿರುತ್ತಾರೆ.
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ,
ಡೇಟಾ ಉತ್ಪಾದಿಸುವ
ಪ್ರಕ್ರಿಯೆಯು ಬಹಳ
ಮುಖ್ಯವಾದ ಘಟಕವಾಗಿದೆ.
ಡೇಟಾ ಉತ್ಪಾದಿಸುವ
ಪ್ರಕ್ರಿಯೆಯ ಮೂಲಕ
ನಾವು ಏನು ಹೇಳುತ್ತೇವೆ
ಎಂಬುದು ನಿಮ್ಮ ಪ್ರಕ್ರಿಯೆ
ಮತ್ತು ನಿಮ್ಮ ಪ್ರಾಯೋಗಿಕ
ಪ್ರಕ್ರಿಯೆಯನ್ನು
ನೀವು ಸಂಗ್ರಹಿಸುತ್ತಿದ್ದ
ಪ್ರಕ್ರಿಯೆ.
ನೀವು ಈ ಪ್ರಯೋಗವನ್ನು
ಹೇಗೆ ನಡೆಸುತ್ತಿದ್ದೀರಿ
ಎಂಬುದು.
ಆದ್ದರಿಂದ, ಒಟ್ಟಾಗಿ,
ಎಲ್ಲವೂ ಡೇಟಾ ಉತ್ಪಾದಿಸುವ
ಪ್ರಕ್ರಿಯೆ.
ನೀವು ಕೇವಲ ಭೌತಿಕ
ಪ್ರಕ್ರಿಯೆ ವಿಶ್ಲೇಷಿಸುತ್ತಿರುವಿರಿ

Marathi: 
परिस्थिती आहे ज्यामध्ये
आपण गृहित धरा प्रक्रिया
स्टॉकेस्टीक असेल
आणि ज्या स्थितीत
आपण पाहत आहात त्या
डेटाचे कारण अज्ञात
आहे. तर, एक साधे उदाहरण
म्हणून समजा, मी स्टॉक
मार्केट निर्देशांकाचा
अंदाज पाहत आहे. प्रत्यक्षात
परिणाम म्हणून अनेक
कारणे आहेत; शेअर
बाजाराच्या निर्देशांकासाठी
अनेक कारणे जबाबदार
आहेत. आता, दुर्दैवाने,
जरी कारणे मला समजतात
तरीसुद्धा मी त्यांच्या
मोजमाप करू शकत नाही
आणि काहीवेळा मला
पुरेसे घटक माहित
नाहीत.
तर, मी काय करू?
मी इतिहासावर अवलंबून
आहे आणि आशा करतो
की इतिहासाची काही
प्रतिष्ठा आहे, आणि
मी ऐतिहासिक नमुन्यांची
आणि सहसंबंधांचे
आणि इतकेच मर्यादित
आहे, आणि एक पूर्वानुमान
तयार करतो, परंतु
हे भविष्य वर्तणूक
अचूक नाही. हा मुद्दा
इतिहासाकडे पाहण्याव्यतिरिक्त
येथे आहे, मुख्य ध्यास
म्हणजे आपण हे बनवले
आहे की हे स्टॉक मार्केट
प्रक्रिया - निर्देशांकाची
निर्मिती करणारी
काही चुकीची प्रक्रिया

Malayalam: 
6 മാസത്തിനുള്ളില്‍
മഴ പെയ്യാന്‍ പോകുകയാണോ,
അല്ലെങ്കില്‍ മറ്റേതെങ്കിലും
അന്തരീക്ഷ പ്രക്രിയയെ
അല്ലെങ്കില്‍ സാമ്പത്തിക
ശാസ്ത്ര പ്രക്രിയയോ
അല്ലെങ്കില്‍ സെന്‍സര്‍
അങ്ങനെ പ്രവചിക്കാന്‍
നോക്കിയാല്‍ ബുദ്ധിമുട്ടാണ്.
ഉദാഹരണത്തിന് സെന്‍സറിലുണ്ടായ
തെറ്റിന്‍റെ അടുത്ത
മൂല്യമെന്താണെന്ന്
നിര്‍ണ്ണയിക്കാന്‍
വളരെ എനിക്ക് പൂര്‍ണ്ണമായ
അറിവ് ഇല്ലെന്ന്
പറയും.
അതുകൊണ്ട് പല സാധ്യതകളും
ഉണ്ടെന്ന് ഞാന്‍
അനുമാനിക്കും.
ഓരോ സാധ്യതകള്‍ക്കും
അവസരം നല്‍കും.
ആ സിദ്ധാന്തത്തിന്‍റെ
ജനനത്തിന് ഇടയാക്കും.
അവിടെയാണ് സമയപരിധിയുടെ
വിശകലനം വരുന്നത്.
നിങ്ങള്‍ക്ക് മറ്റൊരു
കാര്യം കൂടി കണക്കിലെടുക്കേണ്ടതുണ്ട്.
ആ സാഹചര്യത്തില്‍
പ്രക്രിയ stochastic ആണെന്ന്
വിചാരിച്ചാല്‍ നിങ്ങള്‍
നിരീക്ഷിക്കുന്ന
ഡാറ്റ അജ്ഞാതമാണ്.
ഉദാഹരണമായി സ്റ്റോക്ക്
മാര്‍ക്കറ്റ് ഇന്‍ഡക്സ്
പ്രവചനത്തെ ഞാന്‍
പരിഗണിക്കുന്നു.
യഥാര്‍ത്ഥത്തില്‍
ബാധിക്കുന്ന പല കാരണങ്ങള്‍
ഉണ്ട്.
സ്റ്റോക്ക് മാര്‍ക്കറ്റ്
ഇന്‍ഡക്സിന് അനേകം
ഘടകങ്ങള്‍ ഉണ്ട്.
നിര്‍ഭാഗ്യവശാല്‍,
എനിക്ക് കാരണങ്ങള്‍
അറിയാമെങ്കിലും
അവയെ അളക്കുവാന്‍

Bengali: 
হতে হবে না; এটি একটি
সামাজিক প্রক্রিয়া
বা একটি জৈব প্রক্রিয়া
এবং তাই হতে পারে।
এবং আমরা সেন্সর
প্রসেস থেকে তথ্য
সংগ্রহ এবং এই সেন্সর
শুধু শাস্ত্রীয়
হার্ডওয়্যার বা
যন্ত্রানুষঙ্গের
সেন্সর না প্রয়োজন।
এটি মানব সেন্সর
হতে পারে আমরা জরিপ
তথ্য সংগ্রহ করার
সময়, আমরা সেন্সর,
আসলে।

Tamil: 
வகை அனாலிசிஸ் (Analysis)ன்
ஒட்டுமொத்த புரவலன்
உள்ளது, மேலும் பட்டியலிடப்படாத
பல வகைப்பாடுகள்
உள்ளன.
பொதுவாக, நல்ல ஆரம்ப
புள்ளிகள் ஆய்வு
மற்றும் விரிவான
அனாலிசிஸ் (Analysis) மற்றும்
பின்னர் ஒரு வருமானம்;
நீங்கள் முன்மாதிரியாக
ஒரு மாதிரியை உருவாக்கப்
போகிறீர்கள் என்று
முடிவு செய்திருந்தாலும்
கூட, நீங்கள் டேட்டா
(Data) ஆராய்ந்து பார்க்கும்
போது, ​​நீங்கள்
தரவைச் சேர்ப்பது
நல்லது, மேலும் நீங்கள்
ஒரு மாதிரியை உருவாக்குவதற்கு
முன் தரவுகளை நீங்கள்
அறிவீர்கள்.
, உதாரணத்திற்கு.
இப்போது, ​​பொதுவாக,
அனாலிசிஸ் (Analysis) நோக்கமானது
நாம் இங்கே பட்டியலிடப்பட்டுள்ள
குறிப்பிட்ட வகை
பகுப்பாய்வுகளை
நிர்ணயிக்கிறது.
அதாவது, ஒரு பகுப்பாய்வின்
இறுதிப் பயன்பாடு
என்னவென்றால், நீங்கள்
எடுக்கும் தகவலை
எவ்வாறு பயன்படுத்தப்
போகிறீர்கள்?
டேட்டா அனாலிசிஸ்
(Data Analysis) தொடங்கும்
முன்பு, கிடைக்கக்கூடிய
வேறுபட்ட டேட்டா
(Data) என்னவென்பதை அறிய
மிகவும் பயனுள்ளதாக
இருக்கும், ஏனென்றால்
முதன்மையாக நான்
பின்னர் குறிப்பிடுவது
போல, கருவிகள், விளக்கங்கள்
மற்றும் பல படிகள்
தரவுத் தன்மை சார்ந்தது.
இப்போது, ​​மீண்டும்,
நீங்கள் தரவு அனாலிசிஸ்
(Analysis) இலக்கியத்தில்
மாறும் போது, ​​நீங்கள்
வகைப்பாடு வகைகளை
வகைப்படுத்தலாம்,
பல வகைகள் உள்ளன.
உதாரணமாக, நீங்கள்
எண்ணற்ற வசனங்களை
வகைப்படுத்திய வகைப்பாடு
அல்லது நிலையான மாநில
வசனங்கள் டைனமிக்
(Dynamic) மற்றும் பலவற்றைக்
கண்டறிந்து இருக்கலாம்,
ஆனால் நான் அதைப்

Gujarati: 
વિચલન, મધ્ય અને તેથી
વધુ. તેથી, શબ્દ પરિમાણ
અહીં ખૂબ સામાન્ય
રીતે લેવામાં આવશે.

Hindi: 
वास्तव में ऐसे कई
कारण हैं जो वास्तव
में प्रभावित होते
हैं; शेयर बाजार सूचकांक
के लिए जिम्मेदार
कई कारक हैं।
अब, दुर्भाग्यवश,
यहां तक ​​कि यदि
मैं कारणों को जानता
हूं, तो भी मैं उन्हें
मापने में सक्षम
नहीं हो सकता हूं
और कभी-कभी मैं पर्याप्त
रूप से पर्याप्त
कारकों को भी नहीं
जानता हूं।
तो मैं क्या करूं?
मैं इतिहास पर निर्भर
करता हूं, और उम्मीद
करता हूं कि इतिहास
में कुछ प्रतिष्ठा
है, और मैं ऐतिहासिक
पैटर्न और सहसंबंधों
का फायदा उठाता हूं
और भविष्यवाणी करता
हूं, लेकिन भविष्यवाणी
स्पष्ट रूप से सटीक
नहीं है।
मुद्दा यहां है कि
हम इतिहास को देखने
के अलावा, मुख्य धारणा
है कि हम यह मानते
हैं कि यह स्टॉक मार्केट
प्रक्रिया - जो सूचकांक
उत्पन्न करने वाली
कुछ नकली प्रक्रिया
है - प्रकृति में यादृच्छिक
है।
यह बाहर निकलता है,
यह स्टॉक मार्केट
इंडेक्स का कोई भी
मूल्य निकाल सकता
है जिसमें से मैं
एक देख रहा हूं।
वहां कई अन्य संभावनाएं
हो सकती हैं जिनमें
से एक हुआ है।
हकीकत में यह मामला
नहीं हो सकता है।

Malayalam: 
സാധ്യമല്ല.
ചിലപ്പോള്‍ എനിക്ക്
കാര്യമായി ഒന്നും
അറിയില്ല.
അതുകൊണ്ട് ഞാന്‍
എന്തുചെയ്യും?
ഞാന്‍ ചരിത്രത്തെ
ആശ്രയിക്കും.
ചരിത്രത്തിന് നിലവാരം
ഉള്ളതായി ഞാന്‍ കരുതുന്നു.
ചരിത്രപരമായ പാറ്റേണുകളും
പരസ്പരബന്ധങ്ങളും
പരിഗണിച്ച് പ്രവചിക്കുകയും
ചെയ്യുക.
പക്ഷേ ആ പ്രവചനം
തീര്‍ച്ചയായും കൃത്യതയോടെ
ആയിരിക്കുകയില്ല.
ചരിത്രത്തെ നോക്കിക്കാണുന്നത്
ഇവിടെയാണ്.
നമ്മള്‍ ചെയ്യുന്ന
പ്രധാനഅനുമാനം ഈ
സ്റ്റോക്ക് മാര്‍ക്കറ്റ്
പ്രക്രിയയാണ് - അതില്‍
ചില ഇന്‍ഡക്സ് സൃഷ്ടിക്കുന്ന
വ്യാജ പ്രക്രിയയുണ്ട്
- അത് ക്രമരഹിതമായ
പ്രക്രിയയാണ്.
അത് സ്റ്റോക്ക് മാര്‍ക്കറ്റ്
ഇന്‍ഡക്സിന്‍റെ
മൂല്യത്തെയാണ് ഒഴിവാക്കുന്നത്.
അതില്‍ ഒരുപാട് സംഭവങ്ങളുണ്ടായിരുന്നു.
വാസ്തവത്തില്‍ അത്
അങ്ങനെ തന്നെയായിരിക്കില്ല.
യഥാര്‍ത്ഥ പ്രക്രിയ
ആ രീതിയില്‍ ആയിരിക്കില്ല.
ഡാറ്റ വിശകലനത്തില്‍
മുന്നോട്ടുപോകുന്നതിനായാണ്
ഞാന്‍ ഈ അനുമാനം
എടുക്കുന്നത്.
അത് വളരെ പ്രധാനമാണ്.
മറ്റൊരു വിധത്തില്‍
പറഞ്ഞാല്‍, ഞാന്‍
ഒരു പ്രക്രിയയെ stiochastic
ആണെന്ന് വിചാരിച്ചാല്‍
ആ പ്രക്രിയയെക്കുറിച്ച്
എനിക്ക് മതിയായ അറിവുമില്ല

Marathi: 
आहे - हे यादृच्छिक
स्वरुपाचे आहे. तो
बाहेर फेकतो, तो स्टॉक
मार्केट निर्देशांकाची
कोणतीही किंमत काढू
शकते ज्याच्या पैकी
मी एक पाहत आहे. अशा
अनेक शक्यता आहेत
ज्या पैकी एक आली
आहे. प्रत्यक्षात
की केस असू शकत नाही.
खरे प्रक्रिया अशा
पद्धतीने वागू शकत
नाही; मी बनवत आहे
असे एक गृहीत धरून
आहे, त्यामुळे डेटा
विश्लेषणात पुढे
जाण्यासाठी; हे खूप
महत्वाचे आहे. दुस-या
शब्दात सांगायचे
तर, जेव्हा मी स्टॉकेस्टिक
होण्याची प्रक्रिया
गृहीत धरते, तेव्हा
मला असे सांगण्याची
एक औपचारिक पद्धत
आहे की मला प्रक्रियेची
पुरेशी माहिती नाही.
पण अशी परिस्थिती
आहेत जिथे माझ्याकडे
एक मिश्रित केस आहे
- जेथे मला या प्रक्रियेच्या
एका भागाचे खूप चांगले
ज्ञान आहे आणि प्रक्रियेचा
दुसरा भाग माझ्या
पलीकडे आहे इथेच
आपण नियत्रधारणात्मक
आणि स्टोक्यास्टिक
प्रक्रियेचा मिलाफ
केला आहे. आणि अभियांत्रिकी
क्षेत्रामध्ये हे

Bengali: 
পরিশেষে, আমাদের
কাছে আমাদের সাথে
ডেটা আছে এবং সেই
যাত্রার তথ্য বিশ্লেষণে
শুরু হয়।
এই মডিউলের ক্ষেত্রে,
আমরা কীভাবে তথ্য
সংগ্রহ করতে পারি,
স্যাম্পলিংয়ের
কৌশল সম্পর্কে আর
আলোচনা করতে যাচ্ছি
না; আমরা তথ্য বিশ্লেষণ
সম্পর্কে আরো চিন্তিত।
সুতরাং, একবার আমার
কাছে ডেটা আছে, সাধারণত

Kannada: 
ಮಾತ್ರವಲ್ಲ.
ನೆನಪಿಟ್ಟುಕೊಳ್ಳುವುದು
ಬಹಳ ಮುಖ್ಯವಾದ ಕಾರಣ
ನೀವು ರಚಿಸುವ ಡೇಟಾ
ಪ್ರಕಾರಕ್ಕೆ ಎರಡೂ
ಕೊಡುಗೆಗಳು.
ಉದಾಹರಣೆಯಾಗಿ, ನಾವು
ಹೇಳುವುದಾದರೆ, ನಾನು
ಶೀತಕ ಹರಿವಿನಿಂದ ನಿಯಂತ್ರಿಸಲ್ಪಡುತ್ತಿರುವ
ಕೆಲವು ರಿಯಾಕ್ಟರ್
ತಾಪಮಾನವನ್ನು ಗಮನಿಸುತ್ತಿದ್ದೇನೆ.
ಇದು ಅಣು ರಿಯಾಕ್ಟರುಗಳಲ್ಲಿ
ತುಂಬಾ ಸಾಮಾನ್ಯವಾಗಿದೆ.
ಈಗ ನಾನು ವೀಕ್ಷಿಸುತ್ತಿರುವ
ರಿಯಾಕ್ಟರ್ ಭೌತಿಕ
ಪ್ರಕ್ರಿಯೆಯಾಗಿದೆ.
ಉಷ್ಣತೆಯನ್ನು ನಿಯಂತ್ರಿಸಲು
ಪ್ರಯತ್ನಿಸುತ್ತಿರುವ
ಒಂದು ನಿಯಂತ್ರಕವಿದೆ.
ತಾಪಮಾನವನ್ನು ನಿಯಂತ್ರಿಸುವ
ಅದ್ಭುತ ಕೆಲಸ ಮಾಡುತ್ತಿರುವೆ
ಎಂದು ನಾವು ಹೇಳೋಣ.
ಆದ್ದರಿಂದ, ತಾಪಮಾನವು
ಅದರ ಸೆಟ್ ಪಾಯಿಂಟ್ನಲ್ಲಿ
ನಡೆಯುತ್ತದೆ, ಆದರೆ
ನಾನು ಬಳಸುತ್ತಿರುವ
ಸಂವೇದಕವು ತುಂಬಾ ಗದ್ದಲದಂತಾಗುತ್ತದೆ.
ಅಂತಿಮವಾಗಿ, ನನ್ನ
ಬಳಿ ಬರುವ ಮಾಹಿತಿಯು
ಪ್ರಕ್ರಿಯೆ, ಭೌತಿಕ
ಪ್ರಕ್ರಿಯೆ ಮತ್ತು

English: 
for stock market index. Now, unfortunately,
even if I know the causes, I may not be able
to measure them and sometimes I don’t even
know the factors exhaustively enough.
So, what do I do? I depend on the history,
and hope that history has some reputation
in it, and I exploit the historical patterns
and correlations and so on, and make a prediction,
but that prediction is going to be, obviously,
not accurate. The point is here we apart from
looking at the history, the main assumption
that we make is that this stock market process
– that which is some ficticious process
that generating the index - is random in nature.
It throws out, it can throw out any value
of the stock market index out of which I am
observing one. There could have been many
other possibilities out of which one has occurred.
In reality that may not be the case. The true
process may not be behaving that way; it is

Gujarati: 
અનિવાર્યપણે તે અજ્ઞાત
છે કે અમે માહિતીનો
અંદાજ કાઢવાનો પ્રયાસ
કરી રહ્યા છીએ. દેખીતી
રીતે, ડેટા એનાલિસિસ(data
analysis)માં તે એક સામાન્ય

Bengali: 
আমি এটি নির্দিষ্ট
ধাপগুলির মাধ্যমে
রাখি এবং আমরা এটি
সম্পর্কে একটু পরে
আলোচনা করব।
এই পরিকল্পিত উদ্দেশ্যটি
আপনাকে বলতে হয়
যে বিশ্লেষণটি কোথায়
থাকে।
এখানে দুটি শিরোনাম
রয়েছে যা আপনি এখানে
শিরোনাম বিশ্লেষণ
দেখতে পান, এটি মূলত

Tamil: 
பற்றிப் பேசுவதற்குப்
போவதில்லை, ஏனென்றால்
அது நிச்சயமாக முக்கியம்,
ஆனால் மக்கள் பெரும்பாலும்
புறக்கணிக்கின்றார்கள்,
குறைந்தபட்சம் ஆரம்பத்தில்,
தரவு பகுப்பாய்வு
பெரும்பாலும் புறக்கணிக்கப்படுவது
என்பது தத்துவார்த்த
வர்ணங்களின் சீரற்ற
தரவுகளின் வகைப்படுத்தலாகும்.
கோட்பாட்டளவில்
அல்லது கோட்பாடு
தன்னைப் பற்றிய ஒரு
தீர்மானகரமான வசனங்களின்
முற்றுமுழுதாக செயல்முறையிலிருந்து
வெளியே வந்துவிட்டது
என்று நீங்கள் கூறும்
தருணத்தில் பெரும்பாலும்
வேறுபடுவதால் அது
மிகவும் முக்கியமானது.
இப்போது, ​​நிச்சயமாக,
சிலர் சீரற்ற காலத்தைப்
பயன்படுத்துகின்றனர்.
நிர்ணயிக்கப்பட்ட
மற்றும் சீரற்ற இடையே
ஒரு வேறுபாடு உள்ளது;
எனினும், நாம் இங்கே
அந்த வேறுபாட்டை
கவனிக்க மாட்டோம்.
சில நேரங்களில்,
அல்லாத உறுதியான
கால பயன்படுத்தப்படுகிறது.
ஏன் இந்த வகைப்பாடு
அல்லது வேறுபாடு
முக்கியம் என்று
கேட்கும் முன்,தரவு
உருவாக்கும் செயல்முறையின்
அடிப்படையில் வரையறைகளை
பார்ப்போம் . நிர்ணயிக்கப்பட்ட
மற்றும் தற்செயலான
தகுதிகள் தரவிற்கு
இல்லை, அது உண்மையில்,
அவை தரவை உருவாக்கும்
செயல்முறைக்கு தகுதியுடையவை.
தரவு பகுப்பாய்வில்,
டேட்டா (Data) உருவாக்கும்
செயல்முறை ஒரு மிக
முக்கிய நிறுவனமாகும்.
டேட்டா (Data) செயலாக்க
செயல்முறை மூலம்
நாங்கள் என்ன சொல்கிறோம்
என்பது, நீங்கள்
டேட்டா (Data) மற்றும்
உங்கள் சோதனை செயல்முறையிலிருந்து
சேகரிக்கும் செயல்.
நீதான் இந்த பரிசோதனையை
நடத்தினாய்.
எனவே, ஒன்றாக சேர்த்து,
எல்லாம் தரவு உருவாக்கும்
செயல்முறை.
நீங்கள் பகுப்பாய்வு
செய்வது மட்டும்தான்

English: 
an assumption that I am making, so as to move
forward in data analysis; that’s very, very
important. In other words, whenever I assume
a process to be stochastic, it is a formal
way of saying I do not have sufficient understanding
of the process.
But there are situations where I have a mixed
case - where I have a fairly good knowledge
of a part of the process and the other part
of the process is beyond me. That’s where
we have a mix of deterministic and stochastic
process. And that is very common in engineering
arena because a physical process may be well
understood, like in the reactor example that
we discussed earlier, but the sensor or some
effects of unmeasured disturbances, something
that’s beyond my control, those have to
be treated as stochastic simply because I
can not predict them accurately.
So, there we may have to deal with both the
deterministic and stochastic comments, and
there is a theory that allows you to do that.

Hindi: 
असली प्रक्रिया इस
तरह से व्यवहार नहीं
कर सकती है; यह एक
धारणा है जिसे मैं
बना रहा हूं, ताकि
डेटा विश्लेषण (DATA
ANALYSIS)में आगे बढ़ सकूं;
यह बहुत महत्वपूर्ण
है।
दूसरे शब्दों में,
जब भी मैं एक प्रक्रिया
को स्टोकास्टिक मानता
हूं, यह कहने का एक
औपचारिक तरीका है
कि मुझे प्रक्रिया
की पर्याप्त समझ
नहीं है।
लेकिन ऐसी स्थितियां
हैं जहां मेरे पास
एक मिश्रित मामला
है - जहां मेरे पास
प्रक्रिया के एक
हिस्से का काफी अच्छा
ज्ञान है और प्रक्रिया
का दूसरा हिस्सा
मेरे बाहर है।
यही वह जगह है जहां
हमारे पास निर्धारक
और स्टोकास्टिक प्रक्रिया
का मिश्रण है।
और यह इंजीनियरिंग
क्षेत्र में बहुत
आम है क्योंकि एक
भौतिक प्रक्रिया
को अच्छी तरह से समझा
जा सकता है, जैसे कि
रिएक्टर उदाहरण में
हमने पहले चर्चा
की थी, लेकिन सेंसर
या अवांछित गड़बड़ी
के कुछ प्रभाव, जो
मेरे नियंत्रण से
बाहर है, उन्हें स्टोकैस्टिक
के रूप में माना जाना
चाहिए बस क्योंकि
मैं सटीक भविष्यवाणी
नहीं कर सकता।
इसलिए, हमें दृढ़
संकल्प और स्टोकास्टिक

Malayalam: 
എന്ന് പറയാനുള്ള
ഒരു രീതിയാണ്.
എന്നാല്‍ എനിക്ക്
മിശ്രിതമായ സാഹചര്യങ്ങളുണ്ട്
- ഈ പ്രക്രിയയുടെ
ഒരു ഭാഗത്തെ എനിക്ക്
നന്നായി അറിയാം.
പ്രോസസിന്‍റെ മറ്റൊരു
ഭാഗം അറിയില്ലാത്തതുമാണ്.
അതിനാല്‍ deterministic ഉം
stochastic ഉം ആയ പ്രക്രിയയുടെ
മിശ്രിതമാണത്.
എഞ്ചിനീയറിംഗ് മേഖലയില്‍
ഇത് സാധാരണമാണ്.
ഞങ്ങള്‍ മുമ്പ് പറഞ്ഞ
റിയാക്ടര്‍ ഉദാഹരണത്തില്‍
ഭൗതിക പ്രക്രിയ നന്നായി
മനസ്സിലാക്കാന്‍
കഴിയും.
എന്നാല്‍ സെന്‍സര്‍
അല്ലെങ്കില്‍ അളക്കാന്‍
പറ്റാത്ത ചില ഫലങ്ങള്‍
നമ്മുടെ നിയന്ത്രണത്തിനപ്പുറമാണ്.
അവയെ കൃത്യമായി പ്രവചിക്കാന്‍
കഴിയാത്തതിനാല്‍
stochastic ആയി കണക്കാക്കണം.
അതുകൊണ്ട്, deterministic
ഉം stochastic ഉം ആയ രണ്ട്
അഭിപ്രായങ്ങളും
നാം കൈകാര്യം ചെയ്യേണ്ടതായി
വന്നേക്കാം.
അങ്ങനെ ചെയ്യാന്‍
നിങ്ങളെ സഹായിക്കുന്ന
ഒരു സിദ്ധാന്തം അവിടെയുണ്ട്.
താഴെയുള്ള വരിക്ക്
വേണ്ടി കുറച്ച് സമയം
ചിലവഴിക്കണം.

Kannada: 
ನಾನು ಸಂವೇದಕ ಮತ್ತು
ಆ ಸೆನ್ಸರ್ ಗುಣಲಕ್ಷಣಗಳ
ನಡುವಿನ ಪ್ರಕ್ರಿಯೆಯಿಂದ
ನೇರವಾಗಿ ಅಲ್ಲ. ಆ ಸಂವೇದಕದ
ಗುಣಲಕ್ಷಣಗಳು ವಾಸ್ತವವಾಗಿ
ದತ್ತಾಂಶಕ್ಕೆ ಹೋಗುತ್ತದೆ.
ಸಂವೇದಕವು ತುಂಬಾ ಗದ್ದಲದದ್ದಾಗಿದ್ದರೆ,
ನೀವು ಶಬ್ಧದ ಮಾಹಿತಿಯೊಂದಿಗೆ
ಅಂತ್ಯಗೊಳ್ಳುವಿರಿ.
ಸಂವೇದಕ ಪಕ್ಷಪಾತವಾಗಿದ್ದರೆ,
ನಿಮ್ಮ ಡೇಟಾವು ಪಕ್ಷಪಾತವನ್ನು
ತೋರಿಸುತ್ತದೆ.
ಈಗ, ಡೇಟಾ ಉತ್ಪಾದಿಸುವ
ಪ್ರಕ್ರಿಯೆಯು ರಿಯಾಕ್ಟರ್
ಮತ್ತು ಸಂವೇದಕವನ್ನು
ಒಳಗೊಂಡಿರುತ್ತದೆ.
ಡಿ.ಜಿ.ಪಿ - ನಾವು ಸಾಹಿತ್ಯದಲ್ಲಿ
ಸಹ ಕಾಣುವ ಒಂದು ಸಂಕ್ಷಿಪ್ತ
ರೂಪವಾಗಿ ಬಳಸುತ್ತೇವೆ
- ದತ್ತಾಂಶವನ್ನು ನಿಖರವಾಗಿ
ವಿವರಿಸುವ ಗಣಿತದ ಕಾರ್ಯವನ್ನು
ನೀವು ಕಂಡುಕೊಳ್ಳಬಹುದಾದರೆ,
ನಿರ್ಣಾಯಕ ಎಂದು ನಿರ್ಧರಿಸಲಾಗುತ್ತದೆ;
ಅಂದರೆ, ಇದು ಡೇಟಾವನ್ನು
ಮುನ್ಸೂಚಿಸಬಹುದು,
ನೀವು ಸಂಪೂರ್ಣವಾಗಿ
ಹೊಂದಿಕೊಳ್ಳಬಹುದು,
ಪ್ರತಿ ಡಾಟಾ ಪಾಯಿಂಟ್

Marathi: 
खूपच सामान्य आहे
कारण भौतिक प्रक्रिया
चांगल्याप्रकारे
ओळखली जाऊ शकते, जसे
की आम्ही अणुभट्टीच्या
उदाहरणाप्रमाणेच
चर्चा केली होती,
परंतु संवेदक किंवा
अचूक गोंधळ काही
परिणाम, माझ्या नियंत्रणाबाहेरील
काहीतरी, त्यास स्टोचिस्टिक
कारण मी त्यांचे
अचूक अनुमान काढू
शकत नाही. म्हणून,
तिथे आपल्याला दोन्ही
निर्णायक आणि स्टॉकेसिक
टिप्पण्यांशी सामना
करावा लागू शकतो
आणि एक सिद्धांत
आहे ज्यामुळे आपण
हे करू शकता. तर, खालच्या
ओळीत काही क्षण घालवावे
असे - प्रथम आपण डिटरमिनिस्टिकच्या
रूपात डेटाचा विचार
करू इच्छित आहात
किंवा नाही, ते एक
नियतकालिक किंवा
स्टोक्यास्टिक प्रक्रियेतून
बाहेर पडणे किंवा
मिश्र प्रक्रिया
आहे का याचा उत्तर
देणे आवश्यक आहे
आपण असे गृहीत धरले
आहे, कारण विश्लेषणाचा
अभ्यास खरोखर त्यावर
अवलंबून आहे.
ठीक आहे, केवळ जोर
देण्यासाठी, डेटा
नॉन-डिटरमिनिस्टिक
असल्याचे का स्पष्ट
केले गेले आहे, विशेषतः
हे एक सामान्य समज
आहे; खरेतर, बर्याचशा
संशोधक डेटा विश्लेषणातून

Hindi: 
टिप्पणियों दोनों
से निपटना पड़ सकता
है, और एक सिद्धांत
है जो आपको ऐसा करने
की अनुमति देता है।
तो, नीचे की रेखा कृपया
कुछ क्षण पूछने में
बिताएं - सबसे पहले
आप डेटा को निर्धारिती
के रूप में देखना
चाहते हैं, एक निर्धारिती
या स्टोकास्टिक प्रक्रिया
या मिश्रित प्रक्रिया
से बाहर आना, और आपके
पास जवाब होना चाहिए
आपने यह धारणा बनाई
है, क्योंकि विश्लेषण
का पाठ्यक्रम वास्तव
में उस पर निर्भर
करता है।
ठीक है, बस जोर देने
के लिए, इस बात पर
स्पष्ट रहें कि डेटा
को गैर-नियतात्मक
क्यों माना जाता
है, विशेष रूप से यह
एक बहुत महत्वपूर्ण
धारणा है; वास्तव
में, कई कई शोधकर्ता
डेटा विश्लेषण (DATA
ANALYSIS)को यह मानते हुए
करते हैं कि डेटा
को स्टोचस्टिक के
बिना माना जा सकता
है और यह पूछने के
लिए कि यह क्यों और
किस तरह का स्टोकेस्टिक
है।
सिर्फ इसलिए कि मैंने
डेटा को स्टोकेस्टिक
प्रक्रिया से बाहर
आने के लिए माना है,
मैं बस आगे नहीं जा
सकता और अपने डेटा
विश्लेषण (DATA ANALYSIS)को
आगे बढ़ा सकता हूं।

Kannada: 
ಈ ಗಣಿತ ಕಾರ್ಯದ ರೇಖೆಯ
ಮೇಲೆ ಇರುತ್ತದೆ.
ಅದು ನೋಡುವ ಒಂದು ಮಾರ್ಗವಾಗಿದೆ
ಅಥವಾ ನೀವು ಡೇಟಾ ಉತ್ಪಾದಿಸುವ
ಪ್ರಕ್ರಿಯೆಯನ್ನು
ನಿಖರವಾಗಿ ಅರ್ಥಮಾಡಿಕೊಂಡಿದ್ದೀರಿ
ಎಂದು ಹೇಳಬಹುದು; ನೀವು
ವಿವರಿಸಲಾಗದ ಯಾವುದೂ
ಇಲ್ಲ ಅಥವಾ ವೀಕ್ಷಿಸಿದ
ಮೌಲ್ಯಗಳಲ್ಲಿ ಅನಿಶ್ಚಿತತೆ
ಇಲ್ಲ ಎಂದು ನೀವು ಹೇಳಬಹುದು.
ನೀವು ಹೊಂದಿರಬಹುದು
... ಭೌತಿಕ ಪ್ರಕ್ರಿಯೆಯ
ಬಗ್ಗೆ ನೀವು ಉತ್ತಮವಾದ
ಜ್ಞಾನವನ್ನು ಹೊಂದಿರಬಹುದು
ಎಂದು ಅನೇಕ ಬಾರಿ ಏನಾಗುತ್ತದೆ.
ನಾವು ಮೊದಲು ಚರ್ಚಿಸಿದ
ಉದಾಹರಣೆಯಲ್ಲಿ ರಿಯಾಕ್ಟರ್,
ನಾನು ಡೈನಾಮಿಕ್ಸ್,
ಚಲನಶಾಸ್ತ್ರಗಳು, ರಿಯಾಕ್ಟರ್ನ
ಎಲ್ಲವನ್ನೂ, ಥರ್ಮೊಡೈನಾಮಿಕ್ಸ್
ಮತ್ತು ಇನ್ನನ್ನೂ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದು,
ಆದರೆ ನಾನು ಸಂವೇದಕ
ಗುಣಲಕ್ಷಣಗಳ ಬಗ್ಗೆ
ಕಳಪೆ ಜ್ಞಾನವನ್ನು
ಹೊಂದಿರಬಹುದು.

Marathi: 
बाहेर पडू शकतात
जसे की डाटा हे स्टॉकेस्टिक
असणे शक्य नसले तरी
अगदी क्षणभर पॉज
थांबविण्याबद्दल
विचारण्यात आलेले
कारण का आणि कशा प्रकारचे
स्टॉकेस्टिक मी स्टोचॅस्टिक
प्रक्रियेतून बाहेर
येण्यासाठी डेटा
गृहित धरला म्हणून
मी फक्त पुढे जात
नाही आणि माझे डेटा
विश्लेषण पूर्ण करू
शकत नाही. स्टोचॅस्टिक
प्रक्रियेत, अनेक
वर्गीकरण आहेत आणि
मी माझ्या गृहीतात
स्पष्ट असणे आवश्यक
आहे. हे सर्व गृहीतका
नंतर आहे, परंतु तरीही
मला हे स्पष्टपणे
सांगावे लागेल की
ते स्टेशनरी स्टॉकेस्टिक
प्रक्रियेतून, नॉन
स्टेशरी स्टॉकेस्टिक
प्रक्रिया किंवा
नियतकालिक स्टॉकेस्टिक
प्रक्रिया आणि त्यामुळेच.
तर, विविध प्रकारचे
वर्ग आहेत आणि आपल्याला
खूप स्पष्ट असावे.
हे आहे .. हे सर्व नियमित
वर्गीकरणांव्यतिरीक्त
आम्ही विचार केला
पाहिजे- जे स्थिर
राज्य किंवा डायनॅमिक
प्रक्रियेतून बाहेर
पडत आहे किंवा नाही,
ते एकसमान किंवा
विना-रेखीय आहे. हे
सर्व अद्यापही चांगले

English: 
So, the bottom line is please do spent a few
moments asking - first of all whether you
want to treat the data as a deterministic,
coming out of a deterministic or stochastic
process or a mixed process, and you should
have the answer as to why you have made that
assumption, because the course of analysis
really depends upon that.
Okay so, just to emphasise, be clear on why
the data is assumed to be non-deterministic,
particularly this is a very common assumption;
in fact, many many researchers carry out data
analysis assuming the data to be stochastic
without probably even pausing for a moment
to ask why and what kind of stochastic. Just
because I assumed data to be coming out of
a stochastic process, I cannot simply go ahead
and carry out my data analysis. Within the
stochastic processes, there are several classifications
and I have to be clear in my assumption. It
is after all an assumption, but still I have
to be clear as to whether it’s coming out

Bengali: 
ডেটা বিশ্লেষণে যা
দেখা যায় তার প্রতিনিধিত্ব।
উদাহরণস্বরূপ, কল্পনা
বিশ্লেষণের একটি
অংশ।
আপনি কিছু চক্রান্ত
যখন, এবং তথ্য থেকে
কিছু পালন করার চেষ্টা
করুন, যে তথ্য বিশ্লেষণের
একটি অংশ।
এটি একটি অত্যন্ত
গুরুত্বপূর্ণ অংশ
অথবা আপনি কেবল আলোচনা
বা আপনি মডেল নির্মাণ

Malayalam: 
നിങ്ങള്‍ ഡാറ്റയെ
ഒരു deterministic ഘടകമായി
കണക്കാക്കാന്‍ ആഗ്രഹിക്കുന്നുണ്ടോ,
deterministic അല്ലെങ്കില്‍
stochastic പ്രക്രിയ അല്ലെങ്കില്‍
മിശ്രണ പ്രക്രിയയാണോ
ഏതായാലും ആ അനുമാനം
എടുക്കാനുള്ള കാരണം
നിങ്ങള്‍തന്നെ പറയണം.
കാരണം അത് വിശകലനഗതിയെ
യഥാര്‍ത്ഥത്തില്‍
ആശ്രയിച്ചിരിക്കും.
ഡാറ്റ എന്തുകൊണ്ടാണ്
nondeterministic ആയതെന്ന്
ഊന്നിപ്പറയാന്‍
കഴിയണം.
ഇത് വളരെ സാധാരണമായ
ഒരു അനുമാനമാണ്;
വാസ്തവത്തില്‍, നിരവധി
ഗവേഷകര്‍ ഡേറ്റാ
അനാലിസിസ് stochastic ആയി
എടുക്കുന്നു.
എന്തുകൊണ്ടാണ്, എന്തുതരം
ആന്തരിക വൈദഗ്ദ്ധ്യമാണെന്നും
അവിടെ ചിന്തിക്കുന്നില്ല.
അങ്ങനെയുള്ള പ്രക്രിയയില്‍
നിന്ന് പുറത്ത് വരുന്ന
ഡാറ്റ ഞാന്‍ കണക്കിലെടുക്കുമ്പോള്‍,
എനിക്ക് മുന്നോട്ട്
പോകുവാനോ, എന്‍റെ
ഡാറ്റ വിശകലനം നടപ്പിലാക്കാനോ
ചെയ്യാനാവില്ല.
Stochastic ആയ പ്രക്രിയകളില്‍,
പല വര്‍ഗ്ഗീകരണങ്ങളും
ഉണ്ട്, എന്‍റെ അനുമാനത്തില്‍
ഞാന്‍ വ്യക്തമാക്കണം.
ഒരു അനുമാനത്തിന്
ശേഷം അത് stationary stochastic

Gujarati: 
કવાયતો છે. પછી, અલબત્ત,
અમારી પાસે સર્વવ્યાપક
મોડેલ વિકાસ છે. અમને
ઘણા બે અથવા વધુ ચલો

Tamil: 
உடல் செயல்பாடு அல்ல.
நீங்கள் உருவாக்கும்
டேட்டா (Data)வின் வகைக்கு
இருவரும் பங்களிப்பதால்,
நினைவில் வைக்க மிகவும்
முக்கியமானது.
உதாரணமாக, சில உலை
வெப்பநிலையை நான்
கவனித்து வருகிறேன்,
இது குளிர்ச்சியான
ஓட்டம் மூலம் கட்டுப்படுத்தப்படுகிறது.
இது அணு உலைகளில்
மிகவும் பொதுவான
ஒன்றாகும்.
இப்போது, ​​நான்
பார்த்துக்கொண்டிருக்கும்
உலை ஒரு உடல் செயல்பாடு.
அங்கு வெப்பநிலை
மற்றும் கட்டுப்படுத்த
முயற்சி அங்கு ஒரு
கட்டுப்படுத்தி
உள்ளது.
அது வெப்பநிலை கட்டுப்படுத்தும்
ஒரு அற்புதமான வேலை
என்று சொல்கிறேன்.
எனவே, வெப்பநிலை
அதன் செட் (set) புள்ளியில்
நடைபெறுகிறது, ஆனால்
நான் பயன்படுத்தும்
சென்சார் (sensor) மிகவும்
சத்தமாக இருக்கும்.
இறுதியில், எனக்கு
வரும் டேட்டா (Data)
செயல்முறை, உடல்
செயல்முறை மற்றும்
நான் ஒரு சென்சார்
(sensor) மற்றும் சென்சார்
(sensor) பண்புகள் தரவு
இடையே நேரடியாக இல்லை.
அந்த சென்சார் (sensor)
பண்புகள் உண்மையில்
தரவு செல்கிறது.
சென்சார் (sensor) மிகவும்
சத்தம் என்றால்,
நீங்கள் ஒரு சத்தமாக
தரவு முடிவடையும்
போகிறீர்கள்.
சென்சார் (sensor) ஒரு
சார்பு என்றால்,
உங்கள் தரவு ஒரு
சார்பு காண்பிக்கும்.
இப்போது, ​​தரவு
உருவாக்கும் செயல்முறை
அணு உலை மற்றும்
சென்சார் இரண்டையும்
கொண்டுள்ளது.
டீ.ஜி.பி (DGP) - நாம்
இலக்கியத்தில் கூட
காணலாம் என்று ஒரு
சுருக்கமாகப் பயன்படுத்துவோம்
- நீங்கள் துல்லியமாக
தரவை விளக்கக்கூடிய

Bengali: 
করতে পারেন হিসাবে
এবং আপনি প্যারামিটার
মূল্যায়ন বহন করতে
পারে ইত্যাদি।
পরিশেষে, এই তথ্য
বিশ্লেষণ থেকে ফলাফল
আমি খুব ব্যাখ্যা
হিসাবে এই খুব ব্যাপক
অ্যাপ্লিকেশন কিছু
যেতে; এটি প্রক্রিয়া
পর্যবেক্ষণের জন্য
হতে পারে; যে ফল্ট
সনাক্তকরণ হয় বা
প্রক্রিয়া নিয়ন্ত্রণ
জন্য হতে পারে, আমি
পরিমাপ উপর ভিত্তি

Gujarati: 
વચ્ચે મોડેલો વિકાસ
માહિતી એકત્રિત અને
શા માટે આપણે મોડલ
વિકસાવવી જોઈએ?
રસના વેરિયેબલની
આગાહી માટે મોટે

Kannada: 
ಈಗ, ಇದು ತುಂಬಾ ಟ್ರಿಕಿ
ಪರಿಸ್ಥಿತಿ ಮಾಡುತ್ತದೆ.
ಇದು ನಿರ್ಣಾಯಕ ಅಥವಾ
ಸಂಭವನೀಯ ವಿಷಯದಲ್ಲಿಲ್ಲ
ಮತ್ತು ನಾವು ಅದರ ಬಗ್ಗೆ
ಮಾತನಾಡುತ್ತೇವೆ, ಆದರೆ
ಮೂಲಭೂತವಾಗಿ ಇದು ನಿರ್ಧಿಷ್ಟವಾಗಿಲ್ಲ.
ಡೇಟಾವು ನಿರ್ಣಾಯಕ
ಪ್ರಕ್ರಿಯೆಯಿಂದ ಹೊರಬರುತ್ತಿಲ್ಲ
ಏಕೆಂದರೆ DGP ಯ ಭಾಗವಾಗಿ,
ಸಂವೇದಕವು ಸರಿಯಾಗಿ
ತಿಳಿದುಬಂದಿಲ್ಲ.
ಸಾಮಾನ್ಯವಾಗಿ, ಇದು
ಪರಿಸ್ಥಿತಿ; ಸಂವೇದಕಗಳು
ಎಂದಿಗೂ ಅರ್ಥವಾಗುವುದಿಲ್ಲ.
ನೀವು ಬಹಳ ಕಡಿಮೆ ಸಂವೇದಕವನ್ನು
ವಿನ್ಯಾಸಗೊಳಿಸಬಹುದು,
ಅದು ಕಡಿಮೆ ಶಬ್ದವನ್ನು
ಹೊಂದಿರಬಹುದು, ಆದರೆ
ಸಂವೇದಕವು ಪರಿಪೂರ್ಣವಾಗುವುದಿಲ್ಲ
ಮತ್ತು ಸಂವೇದಕವು ನಿಜವಾಗಿಯೂ
ಅರ್ಥವಾಗುವುದಿಲ್ಲ.
ಆದ್ದರಿಂದ ವಾಸ್ತವದಲ್ಲಿ,
ನಿರ್ಣಾಯಕ ಪ್ರಕ್ರಿಯೆಯಂತೆ
ಏನೂ ಇಲ್ಲ. ಇದು ಆದರ್ಶೀಕರಣವಾಗಿದೆ,
ಅದು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಮತ್ತು ಸಿದ್ಧಾಂತವನ್ನು
ಅಭಿವೃದ್ಧಿಪಡಿಸುವಲ್ಲಿ

Tamil: 
கணித செயல்பாட்டைக்
கண்டுபிடிக்க முடியுமா
என்றால், அதாவது,
இது டேட்டா (Data)வை
கணிக்க முடியும்,
நீங்கள் செய்தபின்
பொருந்தும், ஒவ்வொரு
டேட்டா (Data) புள்ளியும்
இந்த கணித செயல்பாட்டின்
வளைவில் உள்ளது.
அதை பார்த்து ஒரு
வழி அல்லது நீங்கள்
டேட்டா (Data) உருவாக்கும்
செயல்முறை சரியாக
புரிந்து என்று சொல்ல
முடியும்; நீங்கள்
விளக்க முடியாது
என்று எதுவும் இல்லை
அல்லது நீங்கள் அனுமதியற்ற
மதிப்புகள் நிச்சயமற்ற
இல்லை என்று சொல்ல
முடியும்.
பல முறை என்ன நடக்கிறது
நீங்கள் உடல் செயல்முறை
பற்றி நல்ல அறிவு
இருக்கலாம்.
உதாரணமாக, நாம் முன்பு
விவாதித்த உதாரணத்தில்
அணு உலை, நான் கினெடிக்ஸ்
(kinetics), உலைகளில் உள்ள
எல்லாவற்றையும்,
தெர்மோனிடமிக்ஸ்
(Thermodynamics) மற்றும் பலவற்றைப்
புரிந்து கொள்ளலாம்,
ஆனால் நான் சென்சார்
குணங்களைப் பற்றி
மோசமான அறிவைப் பெற்றிருக்கிறேன்.
இப்போது, ​​அது மிகவும்
தந்திரமான சூழ்நிலையை
உருவாக்குகிறது.
அது உறுதியான அல்லது
திசைதிருப்பு விஷயத்தில்
அல்ல, அதைப் பற்றி
பேசுவோம், ஆனால்
அடிப்படையில் அது
உறுதியற்றதல்ல.
டீ.ஜி.பி (DGP) பகுதியின்
ஒரு பகுதியான சென்சார்
(sensor) சரியாக புரிந்து
கொள்ளப்படவில்லை
என்பதால் தரவு ஒரு
உறுதியான செயல்முறையிலிருந்து
வெளியே வரவில்லை.
பொதுவாக, இதுதான்
நிலைமை.
சென்சார்(sensor)கள்
ஒருபோதும் சரியாக
புரிந்து கொள்ளப்படவில்லை.
மிகவும் குறைவான
இரைச்சல் கொண்ட மிக
நல்ல சென்சார்(sensor)
வடிவமைக்க முடியும்,

Malayalam: 
process or nonstationary stochastic process
or periodic stochastic process ആണോയെന്ന്
വ്യക്തമാക്കണം.
നിന്ന് വ്യത്യസ്തമായവയുമുണ്ട്
- ഡാറ്റ ഒരു സ്ഥിരമായ
അവസ്ഥയോ ഡൈനാമിക്
പ്രോസസ്സോ, ലീനിയര്‍
അല്ലെങ്കില്‍ നോണ്‍-ലീനിയറോ
ആണ്. ഇവ നല്ല രീതിയിലുണ്ട്.
എന്നാല്‍ നിങ്ങള്‍
എടുക്കേണ്ട വളരെ
പ്രധാനപ്പെട്ട വര്‍ഗ്ഗീകരണമാണത്.
പൊതുവെ, നിങ്ങള്‍ക്ക്
പരീക്ഷണത്തിലേക്ക്
പ്രവേശനം ഉണ്ടെങ്കില്‍,
ഇത് തീര്‍ച്ചയായും,
ഡാറ്റാ വിശകലനത്തിന്‍റെ
പരിധിയ്ക്ക് പുറത്താണ്.
പക്ഷേ നിങ്ങളുടെ
പരീക്ഷണത്തിനിടയില്‍
സാധ്യമെങ്കില്‍
ക്രമരഹിതമായ ഉറവിടങ്ങളെ
അടിച്ചമര്‍ത്തുന്നതുമായി
ഇത് സഹായിക്കും.
അത് ഒരു ഭാഗമാണ്.
പരീക്ഷണങ്ങളുടെ
രൂപകല്പനയില്‍ ശ്രദ്ധേയമായ
ഒരു വിഷയമാണത്.
ഞങ്ങള്‍ അവിടെ ഇപ്പോള്‍
പ്രവേശിക്കുന്നില്ല.
ആളുകള്‍ പലപ്പോഴും
നഷ്ടപ്പെടുത്താറുള്ള
ഏറ്റവും പ്രധാനപ്പെട്ട
കാര്യം - പ്രത്യേകിച്ച്
തുടക്കക്കാര്‍ - ഞാന്‍
ഡാറ്റയില്‍ നിന്ന്
എടുക്കുന്ന എന്തെങ്കിലും
എസ്റ്റിമേറ്റ് അല്ലെങ്കില്‍
എന്തെങ്കിലും അനുമാനമാണ്
- സാധാരണയായി ഒരു

Marathi: 
आहेत, परंतु हे खूप
महत्वाचे वर्गीकरण
आहे जे आपणास सुरुवातीस
करायचे आहे. आणि, सामान्यतः,
जर आपण प्रयोगात
प्रवेश केला तर अर्थात
हे डेटा विश्लेषणाच्या
कार्यक्षेत्राच्या
बाहेर आहे, परंतु
आपल्या प्रयोगादरम्यान
शक्य असल्यास यादृच्छिकतेचे
स्त्रोत दडवण्यासाठी
हे संबंधित आहे. हा
एक भाग आहे, हे एक
प्रयोग आहे जे प्रयोगांच्या
आराखड्यात तपशीलवार
हाताळलेले आहे आणि
आपण येथे त्यामध्ये
जात नाही. सर्वात
महत्वाची गोष्ट जी
लोक बहुतेक चुकतात
- ही सुरुवातीची आहे
- म्हणजे कोणत्याही
अंदाजाचे किंवा कोणत्याही
अनुमानाने मी डेटामधून
काढतो - आणि विशेषत:
भरपूर डेटा यादृच्छिक
किंवा स्टॉकेस्टिक
प्रक्रियेतून बाहेर
येतो असे मानले जाते;
त्या अंदाजपत्रकास
देखील निसर्गात यादृच्छिक
असतात, कारण आपण त्यातील
अनिश्चिततेमुळे
डेटा ठेवत आहात. काही
यंत्रणा, काही सूत्र,
काही गणितीय प्रक्रिया
आणि आपण बाहेर जात
आहेत, उदाहरणार्थ,
मी नमुना अर्थ संगणकीय
आहे. मी जा आणि संवेदनासह
डेटा, परिवेश तापमान

English: 
of a stationery stochastic process, non-stationery
stochastic process or a periodic stochastic
process and so on. So, there are different
categories and we should be very clear. This
is.. all of this is apart from the regular
classifications that we have to think about
- which is whether the data is coming out
of a steady state or dynamic process, linear
or non-linear. All those still hold good,
but this is a very important classification
that you have to make upfront. And, in general,
if you have access to the experiment, this
is, of course, outside the purview of data
analysis, but it’s related to suppress the
sources of randomness if possible during your
experiment. That is a part, that is a topic
that is dealt within detail in design of experiments
and we don’t go into that here.
The most important thing that people often
miss out on - that is beginners - is that

Hindi: 
स्टोकेस्टिक प्रक्रियाओं
के भीतर, कई वर्गीकरण
हैं और मुझे अपनी
धारणा में स्पष्ट
होना चाहिए।
यह सभी धारणा के बाद
है, लेकिन फिर भी मुझे
यह स्पष्ट करना होगा
कि क्या यह स्टेशनरी
स्टोचस्टिक प्रक्रिया
से बाहर आ रहा है,
गैर-स्टेशनरी स्टोचस्टिक
प्रक्रिया या एक
आवधिक स्टोचस्टिक
प्रक्रिया और इसी
तरह।
तो, विभिन्न श्रेणियां
हैं और हमें बहुत
स्पष्ट होना चाहिए।
यह है .. यह सब नियमित
वर्गीकरणों के अलावा
है जिसे हमें इसके
बारे में सोचना है
- यह है कि डेटा एक
स्थिर स्थिति या
गतिशील प्रक्रिया,
रैखिक या गैर-रैखिक
से बाहर आ रहा है या
नहीं।
वे सभी अभी भी अच्छे
हैं, लेकिन यह एक बहुत
ही महत्वपूर्ण वर्गीकरण
है जिसे आपको आगे
बढ़ाना है।
और, सामान्य रूप से,
यदि आपके पास प्रयोग
तक पहुंच है, तो यह
निश्चित रूप से, डेटा
विश्लेषण (DATA ANALYSIS)के
दायरे से बाहर है,
लेकिन यह आपके प्रयोग
के दौरान यदि संभव
हो तो यादृच्छिकता
के स्रोतों को दबाने
से संबंधित है।
यह एक हिस्सा है, यह
एक ऐसा विषय है जिसे
प्रयोगों के डिजाइन
में विस्तार से निपटाया

Kannada: 
ತುಂಬಾ ಉಪಯುಕ್ತವಾಗಿದೆ.
ಈಗ, ನಿಸ್ಸಂಶಯವಾಗಿ,
ಸಂಭವನೀಯತೆಯು ನಿರ್ಣಾಯಕತೆಗೆ
ಎದುರಾಗುವ ಭಾಗವಾಗಿದೆ,
ಅಲ್ಲಿ ನಾವು ಡಿಜಿಪಿ
ನಿಖರವಾಗಿ ಊಹಿಸಬಾರದು
ಅಥವಾ ತಿಳಿದಿಲ್ಲ ಅಥವಾ
ಡೇಟಾದಲ್ಲಿ ಅನಿಶ್ಚಿತತೆಯಿದೆ
ಎಂದು ನೀವು ಹೇಳಬಹುದು.
ಮತ್ತು ನಾನು ಹೇಳಿದಂತೆ,
ಆಚರಣೆಯಲ್ಲಿ, ಪರಿಪೂರ್ಣ
ಜ್ಞಾನ ತಿಳಿದಿಲ್ಲದಿರುವುದರಿಂದ
ಯಾವುದೇ ಪ್ರಕ್ರಿಯೆಯು
ನಿರ್ಣಾಯಕವಾಗಿದೆ.
ಈಗ, ಪ್ರತಿ ಡೇಟಾವನ್ನು
ಉತ್ಪಾದಿಸುವ ಪ್ರಕ್ರಿಯೆಯನ್ನು
ಸಂಭವನೀಯವಾಗಿ ಪರಿಗಣಿಸಬೇಕು
ಎಂದು ಅರ್ಥವೇನು?
ನಿಜವಾಗಿಯೂ ಅಲ್ಲ.
ಯಾವುದೇ ಪ್ರಕ್ರಿಯೆಯು
ನಿಖರವಾಗಿ ಊಹಿಸಲಾರದಿದ್ದರೂ,
ಆಚರಣೆಯಲ್ಲಿ ಇನ್ನೂ
ನಿರ್ದಿಷ್ಟವಾದ ಮತ್ತು
ಸಂಭವನೀಯ ಪ್ರಕ್ರಿಯೆಗಳ
ನಡುವೆ ಇನ್ನೂ ಕೆಲವು
ವ್ಯತ್ಯಾಸಗಳಿವೆ.
ವಿಶಿಷ್ಟವಾಗಿ, ಒಂದು
ಪ್ರಕ್ರಿಯೆಯು ಪ್ರಧಾನವಾಗಿ
ನಿರ್ಣಾಯಕ ಅಥವಾ ಪ್ರಧಾನವಾಗಿ
ಸಂಭವನೀಯವಾಗಿದೆ ಎಂದು

Marathi: 
डेटा एकत्रित करतो.
माझ्या संगणकावर
परत या आणि माझ्या
संगणकात किंवा माझ्या
कॅल्क्युलेटरमध्ये
फीड द्या आणि मी प्रत्यक्षात
नमुना अर्थाचे गणन
करते. नमुना म्हणजे
मी गणना केली आहे
फक्त सरासरी आहे;
काय सरासरी?
अनिश्चिततेमुळे
दूषित झालेले डेटा
तर, त्या अनिश्चिततेने
आपल्या नमुना अर्थाद्वारे
आपल्या मार्गावर
देखील प्रवेश केला
आहे. म्हणून, नमुन्याचे
मूल्य म्हणजे तुमच्याकडे
काही अनिश्चितता
देखील आहेत. येथे
आपली अनिश्चितता
आपल्या गणना त्रुटीच्या
बाबतीत नाही; ते बाजूला
ठेवले पाहिजे.
या प्रकल्पाचा वास्तविक
अर्थ आहे तर आपल्याला
खात्री नसेल की त्यात
अनिश्चितता असणे
आवश्यक आहे; त्या
अनिश्चितता आहे ते
पुन्हा कारण आपण
संकलित केलेला डेटा
आहे .. आपण गोळा केले
जाऊ शकणारे अनेक
संभाव्य डेटा सेटपैकी
एक आहे. तर, तुमच्याकडे
एक नमुना साधी आहे
जो बर्याच शक्य नमुनांपैकी
एक आहे म्हणजे आपण
प्राप्त करू शकला

Hindi: 
जाता है और हम यहां
उसमें नहीं जाते
हैं।
सबसे महत्वपूर्ण
बात यह है कि लोग अक्सर
याद करते हैं - यह
शुरुआती है - यह है
कि कोई अनुमान या
कोई अनुमान जो मैं
डेटा से खींचता हूं
- और आमतौर पर बहुत
सारे डेटा को यादृच्छिक
या स्टोकास्टिक प्रक्रिया
से बाहर माना जाता
है; उन अनुमानों में
अवधारणाएं प्रकृति
में भी यादृच्छिक
हैं, क्योंकि आप उस
डेटा को डाल रहे हैं
जिसमें इसमें अनिश्चितता
है।
कुछ तंत्र के माध्यम
से, कुछ सूत्र, कुछ
गणितीय प्रक्रिया
और आप बाहर निकल रहे
हैं, उदाहरण के लिए,
मैं नमूना माध्य
की गणना कर रहा हूं।
मैं एक सेंसर के साथ
डेटा, परिवेश तापमान
डेटा जाता हूं और
इकट्ठा करता हूं।
मेरे डेस्क पर वापस
आएं और डेटा को मेरे
कंप्यूटर या मेरे
कैलकुलेटर में फ़ीड
करें और मैं वास्तव
में सैंपल माध्य
की गणना करता हूं।
सैंपल का मतलब है
कि मैंने गणना की
है औसत है; क्या?
डेटा जो अनिश्चितताओं
से दूषित है।
इसलिए, उन अनिश्चितताओं
ने भी आपके सैंपल

English: 
any estimate or any inference that I draw
from data - and typically lot of data is assumed
to come out of random or a stochastic process;
those estimates are inferences are also random
in nature, because you are putting through
data which has uncertainty in it. Through
some mechanism, some formula, some mathematical
process and you are getting out, for example,
I am computing the sample mean. I go and collect
data, ambient temperature data, with a sensor.
Come back to my desk and feed in the data
into my computer or my calculator and I actually
compute the sample mean. The sample mean that
I have calculated is simply the average; average
of what? Data that is corrupted with uncertainties.
So, those uncertainties have also made their
way through to your sample mean. So, the value
of sample mean that you have has also some
uncertainties. The uncertainty here is not
with respect to your calculation error okay;

Tamil: 
ஆனால் சென்சார் சரியானது
இல்லை, சென்சார்(sensor)
உண்மையில் சரியாக
புரிந்து கொள்ளப்படுகிறது.
எனவே, உண்மையில்,
ஒரு உறுதியான செயல்முறை
போன்ற ஒன்றுமில்லை.
இது ஒரு சிறந்தது,
இது டேட்டா அனாலிசிஸ்
(Data Analysis) மற்றும் கோட்பாட்டை
வளர்ப்பதில் மிகவும்
பயனுள்ளதாக இருக்கும்.
இப்போது, ​​வெளிப்படையாக,
ஸ்டோசஸ்டிக் ப்ரோசெஸ்
(stochastic processes) என்பது
உறுதியான ஒரு பகுதியாகும்,
டீ.ஜி.பி (DGP) துல்லியமாக
கணிக்க முடியாதது
அல்ல அல்லது அது
தெரியாதது என்று
கூறும் அல்லது தரவுத்தளத்தில்
நிச்சயமற்றதாக இருப்பதை
நீங்கள் கூறலாம்.
நான் சொன்னது போல,
நடைமுறையில் எந்தவொரு
செயல்முறையும் தீர்மானிக்கப்படவில்லை,
ஏனென்றால் சரியான
அறிவு அறியப்படவில்லை.
இப்போது, ​​இது ஒவ்வொரு
தரவு செயலாக்க செயல்முறை
சீரற்ற கருதப்பட
வேண்டும் என்று அர்த்தம்?
உண்மையில் இல்லை.
நடைமுறை மற்றும்
முரண்பாடான செயல்முறைகளுக்கு
இடையில் ஒரு குறிப்பிட்ட
வேறுபாடு காணப்படுகிறது,
நடைமுறையில் கூட
நடைமுறையில் எந்தவிதமான
முன்கணிப்பும் இல்லை
என்றாலும் நடைமுறையில்.
பொதுவாக, நாம் ஒரு
செயல்முறை முக்கியத்துவம்
வாய்ந்ததாகவோ அல்லது
முக்கியமாகத் திசைதிருப்பப்படுவதாகவும்
சொல்கிறோம், மிக
விரைவில் அதைப் பற்றி
பேசுவோம்; இங்கே
இந்த ஸ்லைடு விரைவில்.
எனவே, முன்னர் நாங்கள்
எழுப்பப்பட்ட கேள்விக்கு
மீண்டும் செல்கிறேன்
- ஒரு தீர்மானமான
அல்லது ஒரு சீரற்ற
செயல்முறையிலிருந்து
தரப்பட்டதா என்பதைப்
பற்றி நான் ஏன் கவலைப்பட
வேண்டும்?
ஏன் இந்த ஊகம் மிகவும்
முக்கியம்?

Bengali: 
করে প্রতিক্রিয়া
কর্ম গ্রহণ করছি
যেখানে।
সুতরাং, নিয়ামক
তথ্য গ্রহণ করছেন,
কিছু বিশ্লেষণ করছেন,
এবং তারপর, কিভাবে
ইনপুট উচিত সরানো
সিদ্ধান্ত এটি ডাটা
বিশ্লেষণ বা অপ্টিমাইজেশনের
অ্যাপ্লিকেশনগুলির
একটি অংশও, আমি প্রক্রিয়াটি
পরিচালনা করার একটি
অপটিমাইজড পদ্ধতি
নিয়ে আসার চেষ্টা

Malayalam: 
പാട് ഡാറ്റ ക്രമരഹിതമായ
അല്ലെങ്കില്‍ ഒരു
stochastic പ്രക്രിയയോ
അനുമാനിക്കപ്പെടുന്നു.
അത്തരത്തിലുള്ള
അനുമാനങ്ങള്‍ ക്രമരഹിതമാണ്.
കാരണം നിങ്ങള്‍ അനിശ്ചിതത്വം
നിറഞ്ഞ ഡാറ്റയിലൂടെ
കടന്നുപോവുകയാണ്.
ചില മെക്കാനിസങ്ങള്‍,
ചില ഫോര്‍മുലകള്‍,
ചില ഗണിതപ്രക്രിയകള്‍
എന്നിവയിലൂടെ നിങ്ങള്‍
കടന്നുപോകുന്നു.
ഉദാഹരണത്തിന്, ഞാന്‍
സാമ്പിള്‍ mean കണക്ക്കൂട്ടുന്നു.
ഞാന്‍ ഒരു സെന്‍സറില്‍
ആമ്പിയന്‍റ് താപനില
അറിയാനുള്ള ഡാറ്റ
ശേഖരിക്കുകയും ചെയ്യുന്നു.
എന്‍റെ കമ്പ്യൂട്ടറിലേക്കോ
കാല്‍കുലേറ്ററിലേക്കോ
ഫീഡ് ചെയ്ത് സാമ്പിള്‍
mean യഥാര്‍ത്ഥത്തില്‍
കണക്കാക്കുന്നു.
ഞാന്‍ കണക്ക് കൂട്ടയത്
ശരാശരി മാത്രമാണ്.
എന്തിന്‍റെ ശരാശരി?
അനിശ്ചിതത്വത്തില്‍
നിന്നുള്ള ഡാറ്റയാണ്.
അതിനാല്‍, ഈ അനിശ്ചിതത്വങ്ങള്‍
നിങ്ങളുടെ mean ഉണ്ടാകും.
അതിനാല്‍, സാമ്പിള്‍
mean മൂല്യത്തിലും
ചില അനിശ്ചിതത്വങ്ങളുണ്ട്.
ഇവിടെ നിങ്ങളുടെ
അനിശ്ചിതത്വം നിങ്ങളുടെ
കണക്കുകൂട്ടലിലല്ല.
അത് മാറ്റിവെക്കണം.
അതിലെ അനിശ്ചിതത്വം
ഈ പ്രക്രിയയുടെ യഥാര്‍ത്ഥ

Gujarati: 
ભાગે. પૂર્વાનુમાન
માટેના ટેકનિકલ શબ્દને
અર્થશાસ્ત્ર અને
સામાજિક વિજ્ઞાનમાં
પણ આગાહી કરવામાં
આવે છે; તે ખૂબ સામાન્ય

Bengali: 
করছি, বা প্রক্রিয়াগুলিতে
নতুনত্ব বা পরিবর্তনগুলি
তৈরি করছি।
তারপর, অবশ্যই, কিছু
অন্যান্য অ্যাপ্লিকেশন
আছে যা আমি এখানে
তালিকাভুক্ত নেই,
কিন্তু পরিশেষে আপনাকে
বোঝা উচিত যে ডেটা
বিশ্লেষণটি রাস্তার
শেষ নয়, তবে এটি আসলেই
একটি ডেটা চালিত
প্রক্রিয়ার একটি
অত্যন্ত জটিল শিল্প,
বিশ্লেষণ প্রক্রিয়া

Gujarati: 
શબ્દ છે અને તે પોતે
એક વિશાળ ક્ષેત્ર
છે અને પછી, અમારી
પાસે વિશેષતા છે.

Malayalam: 
mean നിങ്ങള്‍ക്ക്
ഉറപ്പില്ലെന്ന വസ്തുതയുമായി
ബന്ധപ്പെട്ടിരിക്കുന്നു.
അതാണ് അനിശ്ചിതത്വം.
നിങ്ങള്‍ക്ക് സാധ്യമായ
നിരവധി ഡാറ്റ സെറ്റുകള്‍
നിങ്ങള്‍ ശേഖരിച്ചു.
നിങ്ങള്‍ക്ക് സാധ്യമായ
നിരവധി സാമ്പിള്‍
mean നിങ്ങള്‍ക്ക്
ലഭിച്ചു.
ഏതൊരു പരാമീറ്ററിനും
ഇത് സത്യമാണ്.
നിങ്ങള്‍ മറ്റേതെങ്കിലും
slope intercept, അങ്ങനെയുള്ള
ഏതെങ്കിലും പരാമീറ്റര്‍
കണക്കാക്കുകയാണെങ്കില്‍
അത് stochastic ഡാറ്റയില്‍
നിന്നാണ് കണക്കാക്കുന്നത്.
ഡാറ്റയില്‍ പിശകുണ്ടെന്ന്
നിങ്ങള്‍ ഓര്‍മ്മിക്കേണ്ടതാണ്.
വിശകലനവിദഗ്ദ്ധര്‍
എന്ന നിലയില്‍ പിശകിന്‍റെ
വലുപ്പം അല്ലെങ്കില്‍
നിങ്ങള്‍ എടുത്ത
അനുമാനം അല്ലെങ്കില്‍
കണക്കുകൂട്ടലിലുള്ള
അനിശ്ചിതത്വം എല്ലാം
കണക്കിലെടുക്കേണ്ടത്
അത്യാവശ്യമാണ്.
ഇത് ഡാറ്റ വിശകലനത്തിന്‍റെ
വളരെ പ്രധാനപ്പെട്ട
ഭാഗമാണ്.
ഈ പശ്ചാത്തലത്തില്‍,
നിങ്ങള്‍ക്ക് കുറഞ്ഞ
തെറ്റുവരുന്ന ഒരു
മൂല്യനിര്‍ണ്ണയ
രീതി തിരഞ്ഞെടുക്കേണ്ടതുണ്ട്.
അതിനെപ്പറ്റി കുറച്ചുകൂടി
വിശദമായി ഞങ്ങള്‍
സംസാരിക്കും.
നിങ്ങള്‍ കൂടുതല്‍
കൂടുതല്‍ നിരീക്ഷണങ്ങള്‍
ശേഖരിക്കുമ്പോള്‍,
നിങ്ങളുടെ എസ്റ്റിമേറ്റിലെ
പിശക് കേവലം ചുരുങ്ങാന്‍
ആരംഭിക്കുകയും ഏകദേശം
പൂജ്യത്തിലേക്ക്
പോകുകയും ചെയ്യും.

Kannada: 
ನಾವು ಹೇಳುತ್ತೇವೆ
ಮತ್ತು ನಾವು ಅದನ್ನು
ಶೀಘ್ರದಲ್ಲಿಯೇ ಮಾತನಾಡುತ್ತೇವೆ;
ಈ ಸ್ಲೈಡ್ ನಂತರ ಇಲ್ಲಿಯೇ.
ಹಾಗಾಗಿ, ನಾವು ಮೊದಲು
ಬೆಳೆದ ಪ್ರಶ್ನೆಗೆ
ಹಿಂತಿರುಗಿ - ಡೇಟಾವು
ನಿರ್ಣಾಯಕ ಅಥವಾ ಸಂಭವನೀಯ
ಪ್ರಕ್ರಿಯೆಯಿಂದ ಬಂದಿದೆಯೇ
ಎಂಬುದರ ಬಗ್ಗೆ ನಾನು
ಚಿಂತಿಸಬೇಕೇ?
ಈ ಕಲ್ಪನೆಯು ಎಷ್ಟು
ಮುಖ್ಯವಾದುದು?
ಈಗ, ಉತ್ತರ ನಾನು ಮೊದಲೇ
ಹೇಳಿದ ವಿಷಯ - ಆ ಸಿದ್ಧಾಂತ,
ವಿಶ್ಲೇಷಣೆ ಸಾಧನ,
ಮತ್ತು ಫಲಿತಾಂಶಗಳ
ವ್ಯಾಖ್ಯಾನಗಳು ಗಮನಾರ್ಹವಾಗಿ
ಈ ಊಹೆಗಳ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿದೆ.
ಮತ್ತು ಅನೇಕವು ಅನೇಕ
ಉದಾಹರಣೆಗಳನ್ನು ನೀಡಬಹುದು.
ಉದಾಹರಣೆಗೆ, ನಾನು
ಆವರ್ತಕ ಪತ್ತೆಹಚ್ಚುವಿಕೆಯನ್ನು
ನೋಡುತ್ತಿದ್ದೇನೆ,
ಆಗ ಮೊದಲು ಆವರ್ತಕ
ನಿರ್ಣಾಯಕ ಸಿಗ್ನಲ್
ಏನು ಎಂದು ನಾನು ವ್ಯಾಖ್ಯಾನಿಸಬೇಕಾಗಿದೆ.

Tamil: 
இப்போது, ​​பதில்
நான் முன்பு கூறியது
ஒன்றுதான் - அந்த
கோட்பாடு, பகுப்பாய்வுக்கான
கருவி, முடிவுகளின்
விளக்கங்கள் கணிசமாக
இந்த அனுமானங்களை
சார்ந்துள்ளது.
மேலும் பல உதாரணங்கள்
உள்ளன, அவை பலவற்றை
கொடுக்கலாம்.
உதாரணமாக, நான் குறிப்பிட்ட
கால இடைவெளியைக்
கண்டறிந்தால், முதலில்
நான் குறிப்பிட்ட
கால இடைவெளியின்
சிக்னல் (signal) என்ன
என்பதை வரையறுக்க
வேண்டும்.
நான் நிர்ணய தரவு
பார்க்கிறேன் என்றால்,
மற்றும் நான் சீரற்ற
தரவு பார்த்து இருந்தால்,
பின்னர் நான் கால
சீரற்ற செயல்முறை
பொருள் என்ன வரையறுக்க
வேண்டும்.
எனவே, வரையறைகள்
வேறுபடுகின்றன, ஆகையால்
சரி, விளக்கங்கள்
மாறும்.
இதேபோல், நான் ஒரு
முரண்பாடான சமிக்ஞையின்
சராசரியைக் குறிப்பிடும்
போது, ​​பொதுவாக
தவறான கருத்து என்பது
மாதிரி அர்த்தம்,
இது அனுமானத்தில்
இருந்து கணக்கிடப்படும்
சராசரியாகும், செயல்முறையின்
சராசரி என கருதப்படுகிறது;
அதாவது, அது உண்மை
இல்லை.
மாதிரியானது வேறு
அர்த்தத்தில் வரையறுக்கப்படும்
உண்மையான அர்த்தத்தின்
ஒரு மதிப்பீடாகும்,
மேலும் அதைப் பற்றி
விரைவில் பேசுவோம்.
எனவே, இங்கே கீழே
வரி உள்ளது, நீங்கள்
சராசரி வகைகள் அல்லது
சிக்னல் (signal)ன் மற்ற
பண்புகளை பார்க்கிறீர்களா,
நீங்கள் உண்மையில்
புத்தகங்கள் படிக்க
வேண்டும்.
சிக்னல் (signal) எப்படி
வரையறுக்கப்படுகின்றன
என்று கேட்க வேண்டும்.
ஒரு உறுதியான சிக்னல்
(signal)யை நான் பார்த்தால்
- காலவரையின் வரையறை
என்ன?
சராசரி வரையறை என்ன?

Hindi: 
मतलब के माध्यम से
अपना रास्ता बना
दिया है।
तो, सैंपल के मूल्य
का मतलब है कि आपके
पास कुछ अनिश्चितताएं
भी हैं।
यहां अनिश्चितता
आपकी गणना त्रुटि
के संबंध में ठीक
नहीं है; इसे अलग रखा
जाना चाहिए।
इसमें अनिश्चितता
को इस तथ्य के साथ
करना है कि आप सुनिश्चित
नहीं हैं कि यह प्रक्रिया
का सही माध्यम है
या नहीं; यह अनिश्चितता
है।
यह फिर से है क्योंकि
आपके द्वारा एकत्र
किए गए डेटा में .. आपके
द्वारा एकत्र किए
जा सकने वाले कई संभावित
डेटा सेटों में से
एक है।
तो, आपके पास सैंपल
मतलब है जो कई संभव
सैंपल साधनों में
से एक है जिसे आप प्राप्त
कर सकते थे।
और यह किसी भी पैरामीटर
अनुमान के लिए सच
है कि क्या आप ढलान,
अवरोध या किसी अन्य
सहसंबंध का अनुमान
लगा रहे हैं, जो कि
आप स्टोकास्टिक डेटा
से अनुमान लगा रहे
किसी भी अन्य जटिल
पैरामीटर का अनुमान
लगा रहे हैं, आपको
याद रखना होगा कि
डेटा में कोई त्रुटि
है, और एक के रूप में
विश्लेषक, त्रुटि
के आकार या अनुमान

Marathi: 
असता. आणि हे कोणत्याही
पॅरामीटर अंदाजापेक्षा
खरे आहे की आपण उतार,
अडथळा किंवा इतर
कुठल्याही सहसंबंधांचे
अंदाज लावत आहात
किंवा स्टॅटिकॅटिक
डेटाचा अंदाज घेत
असलेला कोणताही अन्य
जटिल पॅरामीटर आपण
लक्षात ठेवू शकता
की डेटामध्ये एक
त्रुटी आहे आणि विश्लेषक,
विश्लेषणाची जबाबदारी
आहे की त्रुटीचा
आकार किंवा अंदाजे
आकलन किंवा आपण रेखांकन
करत असलेल्या अनुमानानुसार
गणना करणे. डेटा विश्लेषणाचा
हा एक फार महत्वाचा
भाग आहे. आणि या संदर्भात,
आपण अंदाज पद्धती
निवडली पाहिजे जी
आपल्याला शक्य तितक्या
लहान त्रुटीसह अंदाज
देते आणि आम्ही त्याबद्दल
तपशीलवार थोडक्यात
चर्चा करू. सर्वात
महत्वाचे म्हणजे
आपण अधिक आणि अधिक
निरिक्षण गोळा केल्याप्रमाणे,
आपल्या अंदाजानुसार
त्रुटी कमी होणे
सुरुवातीला अचूकपणे
शून्यावर जाणे आणि
अनंताला जातो म्हणून
शून्य म्हणून असायला
पाहिजे.
तर, हे काही मापदंड
आहेत आणि अनेकदा
संशोधकांना याची
जाणीव असू शकत नाही.

English: 
that should be kept aside. The uncertainty
in it has got to do with a fact that you are
not sure if this is the true mean of the process;
that is the uncertainty. That’s again because
the data that you collected is has ..is one
of the many possible data sets that you could
have collected. So, you have a sample mean
which is one of the many possible sample means
that you could have obtained. And this is
true for any parameter estimate whether you
are estimating slope, intercept or any other
correlation, any other complicated parameter
that you may be estimating from stochastic
data, you will have to remember that there
is an error in the data, and as an analyst,
it’s the responsibility of the analyst to
compute the size of the error or the uncertainty
in the estimate or the inference that you
are drawing. That’s a very important part
of data analysis. And in this context, you

Bengali: 
অপারেশন এবং তাই;
এবং যখন আমি এখানে
প্রক্রিয়া বলে,
যেহেতু আমি আগে উল্লেখ
করেছি, এর মোটামুটি
সাধারণ এবং এই সব
অবশ্যই, ডোমেন জ্ঞান
খুব, আমি এখানে উজ্জ্বল
হিসাবে খুব গুরুত্বপূর্ণ,
এবং আমরা পরিকল্পিত
ফিরে যখন আমরা এই
সম্পর্কে একটু কথা

Gujarati: 
તેથી, જો તમે ઇસીજી
અથવા ઇઇજી ડેટા જેવા
બાયોમેડિકલ ડેટા
લો, ઉદાહરણ તરીકે.

Marathi: 
म्हणूनच, आपण डेटा
विश्लेषणाच्या प्रक्रियेकडे
पुढे जाण्यापूर्वी
या व्याख्यानाच्या
शेवटच्या भागावर
लक्ष केंद्रित करणे
आवश्यक आहे, डेटा
विश्लेषण साहित्यामध्ये
सामान्यतः आढळलेले
काही परिभाषा सह
परिचित होणे महत्त्वाचे
आहे. आणि इथे, आम्ही
प्रामुख्याने गृहीत
धरू की नॉन-डिटरमिनिस्टिक
प्रक्रियेतून आलेल्या
डेटाशी आम्ही व्यवहार
करणार आहोत कारण
ही सर्वत्र प्रचलित
परिस्थिती आहे. जरी
तुमच्याकडे नियतशास्त्रीय
आणि स्टोक्यास्टिक
प्रक्रियेचे मिश्रण
असले तरीही, ही परिशिष्टे
लागू होतात.
तर, पहिली परिभाषा
जी आम्हाला परिचित
व्हायला हवी - लोकसंख्या
आणि नमुना.
आपल्याला माहित आहे
की स्टॉकेस्टिक प्रक्रियेमध्ये,
जशी आम्ही आधी उल्लेख
केला आहे, जेव्हा
आपण डेटा रेकॉर्ड
प्राप्त करतो तेव्हा
डेटाचे रेकॉर्ड आम्ही
बघतो.ही एक अनेक, अनेक
शक्यतांपैकी एक आहे
- कधी कधी मोजणी केलेले
मर्यादित, कधी कधी
बहुदा असंख्य किंवा
असीम आहेत - अनेक संभाव्य
डेटा रेकॉर्ड अस्तित्वात
आहेत, त्यापैकी आम्ही
एकाचे निरीक्षण केले

Kannada: 
ನಾನು ನಿರ್ಣಾಯಕ ದತ್ತಾಂಶವನ್ನು
ನೋಡುತ್ತಿದ್ದೇನೆ
ಮತ್ತು ನಾನು ಸಂಭವನೀಯ
ಡೇಟಾವನ್ನು ನೋಡುತ್ತಿದ್ದಲ್ಲಿ,
ಆವರ್ತಕ ಯಾದೃಚ್ಛಿಕ
ಪ್ರಕ್ರಿಯೆಯಿಂದ ಅರ್ಥೈಸಿಕೊಳ್ಳುವದನ್ನು
ನಾನು ವ್ಯಾಖ್ಯಾನಿಸಬೇಕಾಗಿದೆ.
ಆದ್ದರಿಂದ, ವ್ಯಾಖ್ಯಾನಗಳು
ಬದಲಾಗುತ್ತವೆ.
ಅಂತೆಯೇ, ನಾನು ಸಂಭವನೀಯ
ಸಿಗ್ನಲ್ನ ಸರಾಸರಿಯನ್ನು
ಉಲ್ಲೇಖಿಸುವಾಗ, ಸಾಮಾನ್ಯವಾಗಿ
ಮಾತಿನ ಅರ್ಥವು, ಅವಲೋಕನದಿಂದ
ಗಣಿಸಲ್ಪಟ್ಟ ಸರಾಸರಿ,
ಪ್ರಕ್ರಿಯೆಯ ಸರಾಸರಿ
ಎಂದು ಪರಿಗಣಿಸಲಾಗುತ್ತದೆ;
ಅಂದರೆ, ಅದು ನಿಜವಲ್ಲ.
ಮಾದರಿ ಸರಾಸರಿ ಎಂಬುದು
ಬೇರೆ ಅರ್ಥದಲ್ಲಿ ವ್ಯಾಖ್ಯಾನಿಸಲಾದ
ನಿಜವಾದ ಅರ್ಥದ ಅಂದಾಜು
ಮಾತ್ರ ಮತ್ತು ಅದರ
ಬಗ್ಗೆ ನಾವು ಶೀಘ್ರವಾಗಿ
ಮಾತನಾಡುತ್ತೇವೆ.
ಹಾಗಾಗಿ, ನೀವು ಇಲ್ಲಿನ
ರೂಪಾಂತರಗಳು ಅಥವಾ
ಸಿಗ್ನಲ್ನ ಯಾವುದೇ
ವಿಶಿಷ್ಟ ಗುಣಲಕ್ಷಣಗಳನ್ನು
ನೋಡುತ್ತಿರುವಿರಾ,
ಇಲ್ಲಿ ನೀವು ನಿಜವಾಗಿಯೂ

Malayalam: 
ചില മാനദണ്ഡങ്ങള്‍
ഇവയാണ്.
പലപ്പോഴും ഗവേഷകര്‍ക്ക്
ഇത് അറിയില്ല.
അതിനാല്‍, ഈ പ്രഭാഷണത്തിന്‍റെ
അവസാനഭാഗം ആയ ഡാറ്റ
വിശകലന പ്രക്രിയയിലേക്ക്
നീങ്ങുന്നതിന് മുമ്പായി,
ഡാറ്റ വിശകലനസാഹിത്യത്തില്‍
സാധാരണയായി കണ്ടുവരുന്ന
ചില പദങ്ങളുമായി
പരിചയത്തിലാകുന്നത്
പ്രധാനമാണ്.
ഇവിടെ, പ്രാഥമികമായി
ഞങ്ങള്‍ ഒരു നിര്‍ണ്ണായകമല്ലാത്ത
പ്രക്രിയയില്‍നിന്ന്
വരുന്ന ഡാറ്റ കൈകാര്യം
ചെയ്യാന്‍ പോകുകയാണ്,
കാരണം അതാണ് എല്ലായിടത്തും
നിലനില്‍ക്കുന്ന
സാഹചര്യം.
നിര്‍ണ്ണായകവും
ആന്തരികവുമായ പ്രക്രിയയുടെ
ഒരു മിശ്രിതവും ഉണ്ടെങ്കില്‍
പോലും ഈ ടെര്‍മിനോളജികള്‍
ബാധകമാണ്.
അതുകൊണ്ട് നമ്മള്‍
പരിചയപ്പെടേണ്ട
ആദ്യത്തെ വാക്കുകള്‍
population and sample ഞങ്ങള്‍
മുമ്പ് സൂചിപ്പിച്ചപോലെ,
stochastic പ്രക്രിയയില്‍
നമുക്ക് ഒരു ഡാറ്റ
റെക്കാര്‍ഡ് ലഭിക്കുമ്പോള്‍,
സാധ്യമായ എല്ലാ ഡാറ്റയുടെ
റിക്കോര്‍ഡ് ഞങ്ങള്‍
നിരീക്ഷിക്കുന്നു.
അനേകം സാധ്യതകളില്‍
ഉണ്ടാകാം - ചിലപ്പോള്‍
പരിമിതമായ ഡാറ്റയും
- പല നിരീക്ഷിക്കുന്ന
ഡേറ്റാ റെക്കോര്‍ഡുകള്‍
നിലവിലുണ്ട്.
അതൊരു സിദ്ധാന്തമാണ്.
ആ സിദ്ധാന്തത്തിന്‍റെ
അടിസ്ഥാനത്തിലാണ്

Tamil: 
நான் ஒரு பழங்கால
சிக்னலை (signal) பார்க்கிறேன்
என்றால் - வரையறை
என்ன?
பின்னர், நீங்கள்
அர்த்தமுள்ள விளக்கங்கள்
செய்யலாம்.
மிகவும் பொதுவான
சூழ்நிலை, ஆற்றலைக்
கண்டறிதல் மற்றும்
அவ்வப்போது பயன்படுத்தக்கூடிய
ஆற்றல் நிறமாலை அடர்த்தி
ஆகும்.
எப்படியிருந்தாலும்,
நாம் மிகவும் விவரமாக
செல்லமாட்டோம், ஆனால்
இந்த உண்மையை நீங்கள்
நினைவில் கொள்ள வேண்டும்,
ஒவ்வொரு முறையும்
நீங்கள் தரவுகளை
சேகரித்து, சில முக்கியமான
கேள்விகளைக் கேட்க
தரவுகளை பகுப்பாய்வு
செய்யுங்கள், அந்த
கேள்விகளில் ஒன்று
- நான் எதைப் பற்றி
நினைக்கிறேன் தரவு
உருவாக்கும் செயல்முறை.
எனவே, டேட்டா அனாலிசிஸ்
(Data Analysis)வில் பொதுவாக
பின்பற்றப்படும்
ஒரு நடைமுறை என்ன
என்பதை அறிந்து கொள்வதற்கு
முன்னர், இந்த விவாதத்தை
முடிவெடுப்பது அல்லது
முடிவில்லாமல் இந்த
விவாதத்தை மூடுவதற்கு
மீண்டும் நல்லது
- டீ.ஜி.பி (DGP) நிர்ணயிக்கப்பட்ட
அல்லது சீரற்றதா?
சிலர் வந்து என்னிடம்
சொல்வார்களா?
வெளிப்படையாக இல்லை.
இலக்கியத்தில் நான்
காணலாமா?
சில நேரங்களில் ஆமாம்,
ஆனால் பெரும்பாலான
நேரங்களில் நான்
பார்த்துக்கொண்டிருக்கும்
செயல்முறை இல்லை.
எனவே, ஒரு முன்னுரை
தெரிந்துகொள்ள ஒரு
வழி இருக்கிறதா?
சரி, துரதிருஷ்டவசமாக,
தரவு ஒரு உறுதியான
அல்லது சீரற்ற செயல்முறை
வெளியே வருகிறது
என்பதை கண்டுபிடிக்க
நீங்கள் சரியான போர்முலா
(formula) இல்லை; ஆனால்
நீங்கள் எவ்வளவு
தெரியுமோ அவ்வளவுக்கு
தெரியாத அளவுக்கு
நீங்கள் எவ்வளவு
தெரியுமா?

English: 
should choose an estimation method that gives
you an estimate with as small error as possible
and we will talk about it a bit more in detail.
More importantly that as you collect more
and more observations, the error in your estimate
should ideally start shrinking and go to zero
asymptotically as n goes to infinity. So,
these are some criteria and very often many
of the researchers may not be aware of this.
So, before we move on to the data analysis
procedure which is the last part of this lecture,
it’s important to at least gain familiarity
with some terminology that’s commonly found
in the data analysis literature. And here,
we will assume primarily that we are going
to deal with data that comes from a non-deterministic
process, because that’s the prevalent situation
everywhere. Even if you have a mix of deterministic
and stochastic process, these terminologies

Hindi: 
में अनिश्चितता या
अनुमान लगाए जाने
वाले अनुमान की गणना
करने के लिए विश्लेषक
की ज़िम्मेदारी है।
यह डेटा विश्लेषण
(DATA ANALYSIS)का एक बहुत
ही महत्वपूर्ण हिस्सा
है।
और इस संदर्भ में,
आपको एक अनुमान विधि
चुननी चाहिए जो आपको
यथासंभव छोटी त्रुटि
के साथ अनुमान प्रदान
करे और हम इसके बारे
में कुछ और विस्तार
से बात करेंगे।
सबसे महत्वपूर्ण
बात यह है कि जब आप
अधिक से अधिक अवलोकन
एकत्र करते हैं, तो
आपके अनुमान में
त्रुटि आदर्श रूप
से घटने लगती है और
शून्य के रूप में
शून्य पर जाती है
और अनंत तक जाती है।
इसलिए, ये कुछ मानदंड
हैं और अक्सर कई शोधकर्ता
इस बारे में अवगत
नहीं हो सकते हैं।
इसलिए, इससे पहले
कि हम इस व्याख्यान
का अंतिम भाग डेटा
विश्लेषण (DATA ANALYSIS)प्रक्रिया
में आगे बढ़ें, कम
से कम कुछ शब्दावली
के साथ परिचितता
हासिल करना महत्वपूर्ण
है जो आमतौर पर डेटा
विश्लेषण (DATA ANALYSIS)साहित्य
में मिलता है।
और यहां, हम मुख्य
रूप से मान लेंगे
कि हम गैर-निर्धारिती
प्रक्रिया से आने

Hindi: 
वाले डेटा से निपटने
जा रहे हैं, क्योंकि
यह हर जगह प्रचलित
स्थिति है।
भले ही आपके पास निर्धारक
और स्टोकास्टिक प्रक्रिया
का मिश्रण हो, फिर
भी ये शब्दावली लागू
होती हैं।
तो, पहली शब्दावली
जिसे हमें परिचित
होना है शब्द - आबादी
और नमूना है।
हम जानते हैं कि स्टोकास्टिक
प्रक्रिया में, जैसा
कि हमने पहले उल्लेख
किया था, हम देखते
हैं कि जब हमें डेटा
रिकॉर्ड मिलता है,
तो हमारे पास डेटा
का रिकॉर्ड होता
है कई, कई संभावनाओं
में से एक है - कभी-कभी
गिनती से सीमित, कभी-कभी
गिनती अनंत या अनंत
- कई संभावित डेटा
रिकॉर्ड मौजूद होते
हैं, जिनमें से हमने
एक को देखा है; वह
सिद्धांत है, संपूर्ण
सिद्धांत उस आधार
पर बनाया गया है।
जनसंख्या उन सभी
संभावनाओं को संदर्भित
करती है जिन्हें
आप देख सकते थे, हालांकि
हम इसका पालन नहीं
करते हैं; ज्यादातर
स्थितियों में वास्तव
में सभी संभावनाओं
को देखना या देखना
संभव नहीं है।
इसलिए, आबादी सभी
घटनाओं या संभावनाओं
के संग्रह को संदर्भित
करती है।
जब तापमान माप के
संबंध में हमने वातावरण

Gujarati: 
ઇસીજી ડેટામાં તમે
જોયું છે કે નહીં,
પરંતુ ઇસીજી એ કંઈક
છે જે આપણે બધાએ શોધી

English: 
apply.
So, the first terminology that we have to
be familiar with is the term - population
and sample. We know that in stochastic process,
as we just mentioned earlier, we observe when
we get a data record, the record of data that
we have is one of the many, many possibilities
- sometime countably finite, sometimes countably
infinite or infinite - many possible data
records exist, out of which we have observed
one; that is the theory, the entire theory
is built on that premise. The population refers
to all possibilities that you could have seen,
although we do not observe that; it is not
possible to really have or observe all the
possibilities in most of the situations. So,
population refers to the collection of all
events or possibilities.

Kannada: 
ಪುಸ್ತಕಗಳಿಗೆ ಹಿಂತಿರುಗಿ
ಹೋಗಬೇಕು ಮತ್ತು ನಾನು
ನೋಡುವ ಸಿಗ್ನಲ್ಗೆ
ಹೇಗೆ ವ್ಯಾಖ್ಯಾನಿಸಲ್ಪಡಬೇಕು
ಎಂಬುದನ್ನು ಇಲ್ಲಿ
ಕೆಳಗೆ ತೋರಿಸಬೇಕು.
ನಾನು ನಿರ್ಣಾಯಕ ಸಂಕೇತವನ್ನು
ನೋಡುತ್ತಿದ್ದೇನೆ
- ಆವರ್ತಕತೆಯ ವ್ಯಾಖ್ಯಾನವೇನು?
ಅರ್ಥದ ವ್ಯಾಖ್ಯಾನ
ಏನು?
ನಾನು ಸಂಭವನೀಯ ಸಂಕೇತವನ್ನು
ನೋಡುತ್ತಿದ್ದರೆ - ವ್ಯಾಖ್ಯಾನ
ಏನು?
ತದನಂತರ, ನೀವು ಅರ್ಥಪೂರ್ಣ
ವ್ಯಾಖ್ಯಾನಗಳನ್ನು
ಮಾಡಬಹುದು.
ಮತ್ತು ಅತಿ ಸಾಮಾನ್ಯ
ಪರಿಸ್ಥಿತಿ ಆವರ್ತನದ
ಪತ್ತೆಹಚ್ಚುವಿಕೆಗೆ
ಬಳಸಲಾಗುವ ವಿದ್ಯುತ್
ಸ್ಪೆಕ್ಟ್ರಾಲ್ ಸಾಂದ್ರತೆಯು.
ಹೇಗಾದರೂ, ನಾವು ಹೆಚ್ಚು
ವಿವರವಾಗಿ ಹೋಗುವುದಿಲ್ಲ,
ಆದರೆ ನೀವು ಈ ಸತ್ಯವನ್ನು
ನೆನಪಿನಲ್ಲಿಟ್ಟುಕೊಳ್ಳಬೇಕು,
ಮತ್ತು ನೀವು ಡೇಟಾವನ್ನು
ಸಂಗ್ರಹಿಸಿದಾಗ ಮತ್ತು
ನೀವು ಕುಳಿತುಕೊಳ್ಳುವ
ಕೆಲವು ಸಮಯ ಕೆಲವು
ಪ್ರಮುಖ ಪ್ರಶ್ನೆಗಳನ್ನು
ಕೇಳಲು ಡೇಟಾವನ್ನು

Tamil: 
அந்த செயல்முறை பற்றி.
எனவே, உதாரணமாக, நான்
ஒரு பந்தை வைத்திருக்க
வேண்டும், ஒரு அறையில்,
அங்கு அதிக காற்று
இல்லை.
காற்று மிகவும் நன்றாக
உள்ளது மற்றும் நான்
பந்து கைவிட போகிறேன்.
பிசிக்ஸ்(Physics)ன் உதவியுடன்
பந்தை எடுக்கும்
அளவு எவ்வளவு நேரம்
எடுக்கும் என்பதை
கணக்கிடுவதன் மூலம்
நாம் மிகவும் அதிகமாக
முடியும்.
இது மிகவும் உறுதியான
செயல்முறை.
அங்கு மிகவும் நிச்சயமற்ற
இல்லை.
மறுபுறம், நான் நாளை
மழை பெய்யக்கூடுமா
அல்லது 6 மாதங்களில்
மழை பொழிகிறதா இல்லையா
எனக் கேட்கப்பட்டால்
அல்லது வேறு ஏதேனும்
வளிமண்டல செயல்முறை
சிறப்பியல்புகள்
அல்லது பொருளாதார
சிக்கல் செயல்முறை
போன்றவை அல்லது ஒரு
சென்சார் சத்தம்
மற்றும் இல், இது,
உதாரணமாக, உணரியின்
பிழை அடுத்த மதிப்பு
என்ன என்பதை கணிப்பது
மிகவும் கடினம்.
அத்தகைய சூழ்நிலைகளில்,
நாம் தற்செயலான தத்துவத்தை
எடுத்துக் கொள்கிறோம்,
மற்றும் செயல்முறை
பற்றிய சரியான அறிவு
எனக்கு இல்லை என
நாங்கள் கூறுகிறோம்.
எனவே, நான் பல சாத்தியக்கூறுகள்
இருப்பதாகக் கருதுகிறேன்,
ஒவ்வொரு சாத்தியக்கூறுகளுக்கும்
வாய்ப்புகளை நான்
ஒதுக்கிறேன், மேலும்
நிகழ்தகவு கோட்பாடு
பிறப்பு எங்கு நடைபெறுகிறது
என்பதும், நேரத்தின்
தொடர் பகுப்பாய்வு
எங்கு செல்கிறது
என்பதும் இங்குதான்.
செயல்முறை இருக்க
வேண்டும் மற்றும்
அந்த சூழ்நிலையில்
நீங்கள் தேடும் தரவு
காரணம் தெரியவில்லை.

Malayalam: 
എല്ലാം തയ്യാറാക്കുന്നത്.
നിങ്ങള്‍ കണ്ടേക്കാവുന്ന
എല്ലാ സാധ്യതകളെയും
population സൂചിപ്പിക്കുന്നു.
ചിലപ്പോള്‍ കാണാത്ത
കാര്യങ്ങളുമുണ്ടാകാം.
മിക്കവാറും സാഹചര്യങ്ങളില്‍
എല്ലാ സാധ്യതകളും
ശരിക്കും കാണുകയോ
നിരീക്ഷിക്കുകയോ
സാധ്യമല്ല.
അതി്നാല്‍ population എല്ലാ
സാധ്യതകളെയും സൂചിപ്പിക്കുന്നു.
നാം മുമ്പ് അന്തരീക്ഷത്തെക്കുറിച്ച്
സംസാരിച്ച താപനില
അളവനുസരിച്ചായിരുന്നു.
ഒരു സെന്‍സര്‍ ഉപയോഗിച്ച്
ഒരു നിശ്ചിതസമയത്തില്‍
100 നിരീക്ഷണങ്ങള്‍
ശേഖരിച്ചാല്‍, മറ്റൊരു
സെന്‍സര്‍ അത് മറ്റൊരു
വിധത്തില്‍ നോക്കിക്കാണും;
അതിനാല്‍ മറ്റൊകു
ഡാറ്റ റെക്കാര്‍ഡ്
അസാധ്യമാണെങ്കിലും
അതേ സെന്‍സര്‍ വച്ചു
രേഖപ്പെടുത്താന്‍
കഴിയുമായിരുന്നു.
എല്ലാം സ്ഥിരമാക്കിയാല്‍
തികച്ചും വ്യത്യസ്തമായ
മൂല്യങ്ങള്‍ രേഖപ്പെടുത്താവുന്നതാണ്.
സാധ്യമായ എല്ലാ മൂല്യങ്ങളും
ലഭിക്കാന്‍ കഴിയണമെന്നില്ല.
പക്ഷേ സൈദ്ധാന്തികമായി
ഇത് സാധ്യമായ എല്ലാ
കാര്യങ്ങളും സങ്കല്പിക്കേണ്ടതുണ്ട്.
ഒരു സാമ്പിളില്‍
നിന്ന് നമുക്ക് ലഭിക്കുന്ന

Marathi: 
आहे; हे सिद्धांत
आहे, त्या सिद्धांतावर
संपूर्ण सिद्धान्त
तयार केले आहे. लोकसंख्येमध्ये
आपण बघू शकणाऱ्या
सर्व शक्यतांचा उल्लेख
केला आहे, मात्र आम्ही
त्याकडे दुर्लक्ष
करत नाही; बहुतेक
परिस्थितींमध्ये
खरोखरच शक्य आहे
किंवा सर्व शक्यतांचा
निरीक्षण करणे शक्य
नाही. म्हणून, लोकसंख्या
म्हणजे सर्व प्रसंग
किंवा संकल्पनांचे
संकलन.
आम्ही आधीच्या वातावरणाविषयी
बोललो त्या तपमान
मापदंडाच्या बाबतीत.
जर मी वेळोवेळी एक
सेन्सॉरसह शंभर अंश
संग्रहित केले तर
दुसर्या सेन्सरने
वेगळ्या पद्धतीने
हे पाहिले असते; जेणेकरून
इतर डेटा रेकॉर्ड
अशक्य होऊ शकले असते
किंवा तेच सेन्सर
स्वत: रेकॉर्ड करू
शकले असते, सर्वकाही
कायम राहते ते पूर्णपणे
भिन्न मूल्य नोंदवू
शकले असते. तर, सर्व
संभाव्य मूल्यांची
जाणीव करणे शक्य
नाही, परंतु सैद्धांतिकदृष्ट्या
ही सर्व शक्य जागा
कल्पना करणे महत्त्वाचे
आहे आणि आम्ही त्यास
लोकसांख्या म्हणतो
ज्याचे आम्ही एक
नमुना मिळवितो.

Bengali: 
বলতে হবে এবং তথ্য
বিশ্লেষণ জড়িত যে
পদ্ধতিগত পদ্ধতি
নিয়ে আলোচনা।
সুতরাং, আশা করি, আপনি
বুঝতে পারেন যে কোথায়
ডেটা বিশ্লেষণ রয়েছে।
এটি আসলে তথ্যের
বিশদ বিশ্লেষণ করে
বিশ্বের বিশ্বকে
সংযুক্ত করে।
আপনার বিশ্লেষণের
প্রয়োজন এবং শেষ
ব্যবহারের উপর ভিত্তি
করে, বিশ্লেষণের
অনেকগুলি বিভিন্ন
ধরনের, এখনই, এখন,

English: 
When with respect to the temperature measurement
that we talked about earlier of the ambience.
If I collect hundred observations with one
sensor over a period of time, another sensor
would have viewed that in a different manner;
so that, another data record could have been
impossible or the same sensor itself could
have recorded, everything held constant could
have recorded completely different values.
So, it’s not possible obviously to realize
all those possible values, but theoretically
it is important to imagine this all possible
space and we call it as population of which
we obtain one sample. When I say sample here
it is not one observation, a sample in statistics
typically refers to collection of observations.
It basically refers to one data record, but
in signal processing, a sample could be one
value at an instant and that is in the deterministic
world. Corresponding to this population and

Tamil: 
எனவே, ஒரு எளிய உதாரணமாக,
நான் பங்குச் சந்தை
குறியீட்டின் கணிப்பு
பற்றி நினைக்கிறேன்.
உண்மையில் பாதிக்கக்கூடிய
பல காரணங்கள் உள்ளன;
பங்கு சந்தை குறியீட்டுக்கு
பல காரணிகள் உள்ளன.
இப்போது, ​​துரதிருஷ்டவசமாக,
நான் காரணங்கள் தெரிந்தாலும்
கூட, அவற்றை நான்
அளவிட முடியாது,
சில நேரங்களில் நான்
கூட காரணங்கள் முற்றிலும்
அறிந்திருக்கவில்லை.
எனவே, நான் என்ன செய்வது?
வரலாற்றில் நான்
நம்பியிருக்கிறேன்,
வரலாற்றில் அது சில
நற்பெயரைக் கொண்டிருக்கிறது
என்று நம்புகிறேன்,
வரலாற்று முறைகள்
மற்றும் கூட்டுறவு
மற்றும் பலவற்றைப்
பயன்படுத்தி, ஒரு
கணிப்பைத் தயாரிக்கிறேன்,
ஆனால் அந்த முன்னறிவிப்பு
துல்லியமானதாக இல்லை,
வெளிப்படையாக இல்லை.
வரலாற்றைப் பார்ப்பது
தவிர இங்கே நாம்
இருக்கிறோம், நாம்
செய்யும் முக்கிய
அனுமானம் என்னவென்றால்
இந்த பங்குச் சந்தை
செயல்முறை - குறியீட்டு
உருவாக்கும் சில
போலித்தனமான செயல்முறை
- இயல்பிலேயே சீரற்றதாக
இருக்கிறது.
அது வெளியே தள்ளுகிறது,
அது பங்குச் சந்தை
குறியீட்டின் எந்தவொரு
மதிப்பையும் நான்
கவனித்து வருகிறேன்.
வேறு பல சாத்தியக்கூறுகள்
இருந்தன.
உண்மையில் அந்த வழக்கு
இருக்கலாம்.
உண்மையான செயல்முறை
அப்படி நடந்துகொள்வதில்லை;
இது டேட்டா அனாலிசிஸ்
(Data Analysis)ல் முன்னோக்கி
நகர்த்துவதற்காக
நான் செய்கின்ற ஒரு
யூகிப்பு ஆகும்;
அது மிகவும் முக்கியம்.
வேறு வார்த்தைகளில்
கூறுவதானால், நான்
ஒரு செயல்முறையில்
பழக்கவழக்கத்தை
எடுத்துக்கொள்ளும்
போதெல்லாம், இது

Malayalam: 
population എന്നാണ് ഞങ്ങള്‍
അതിനെ വിളിക്കുന്നത്.
ഞാന്‍ സാമ്പിള്‍
ഇവിടെ പറഞ്ഞാല്‍
അത് കേവലം ഒരു നിരീക്ഷണമല്ല.
സ്ഥിതിവിവരക്കണക്കുകളിലെ
ഒരു സാമ്പിള്‍ സാധാരണയായി
നിരീക്ഷണങ്ങളുടെ
ശേഖരത്തെ പരാമര്‍ശിക്കുന്നു.
ഇത് അടിസ്ഥാനപരമായി
ഒരു ഡാറ്റ റെക്കോര്‍ഡിനെ
സൂചിപ്പിക്കുന്നു.
എന്നാല്‍ സിഗ്നല്‍
പ്രോസസിങ്ങില്‍
സാമ്പിളിന് ഒരു സമയത്ത്
ഒരു മൂല്യമായിരിക്കാം.
അതൊരു നിര്‍ണ്ണായകപ്രക്രിയയാണ്.
ഈ population ഉം മാതൃകയ്ക്കും
വിധേയമായി ഞങ്ങള്‍ക്ക്
ഒരു സത്യവും ഒരു
അനുമാനവുമുണ്ട്.
population എല്ലാ സാദ്ധ്യതകളുടെയും
ഒരു ശേഖരമാണെന്ന്
ഞങ്ങള്‍ പറഞ്ഞു.
പക്ഷേ അത് സത്യത്തെ
ആശ്രയിച്ചിരിക്കുന്നു.
ആയതിനാല്‍, ഈ മുഴുവന്‍
population ല്‍ ചില mean ഉണ്ട്.
ഉദാഹരണത്തിന്, വലിയൊരു
രാജ്യത്തിലെ അല്ലെങ്കില്‍
ഒരു കമ്പനിയിലെ ഒരു
കൂട്ടം ആളുകളുടെ
ശരാശരി ശമ്പളം കണക്കാക്കുന്നത്.
ഓരോരുത്തരുടെയും
അടുത്തുപോയി ചോദിക്കുന്നത്
എനിക്ക് സാധ്യമല്ല.
പ്രായോഗികകാരണങ്ങളാല്‍,
കുറച്ചുപേരെ കണ്ടെത്തി
അവരുടെ ശമ്പളത്തെക്കുറിച്ച്
ചോദിക്കുകയും അതില്‍നിന്ന്
യഥാര്‍ത്ഥമായ ശരാശരി
ശമ്പളം അനുമാനിക്കുകയും
ചെയ്യും.

Kannada: 
ವಿಶ್ಲೇಷಿಸುತ್ತದೆ,
ಮತ್ತು ಆ ಪ್ರಶ್ನೆಗಳಲ್ಲಿ
ಯಾವುದಾದರೂ ಒಂದು ಅಂಶವೆಂದರೆ
- ಡೇಟಾ ಉತ್ಪಾದಿಸುವ
ಪ್ರಕ್ರಿಯೆ.
ಆದ್ದರಿಂದ, ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಸಾಮಾನ್ಯವಾಗಿ ಅನುಸರಿಸುತ್ತಿರುವ
ಪ್ರಕ್ರಿಯೆಯನ್ನು
ನಾವು ಕಲಿಯಲು ಮುಂದಾಗುವ
ಮೊದಲು, ನಿರ್ಣಾಯಕ
ಅಥವಾ ಸಂಭವನೀಯತೆಯ
ಬಗ್ಗೆ ಈ ಚರ್ಚೆಯನ್ನು
ಮುಚ್ಚುವುದು ಒಳ್ಳೆಯದು.
ಡಿಜಿಪಿಯನ್ನು ನಿರ್ಣಾಯಕ
ಅಥವಾ ಸಂಭವನೀಯ ಎಂದು
ಯಾವಾಗ ಕೆಲವರು ಬಂದು
ನನಗೆ ಹೇಳುತ್ತೀರಾ?
ನಿಸ್ಸಂಶಯವಾಗಿ ಅಲ್ಲ.
ನಾನು ಸಾಹಿತ್ಯದಲ್ಲಿ
ಕಾಣಬಹುದೇ?
ಕೆಲವು ಬಾರಿ ಹೌದು,
ಆದರೆ ನಾನು ನೋಡುವ
ಪ್ರಕ್ರಿಯೆಗೆ ಹೆಚ್ಚಿನ
ಸಮಯ ಇಲ್ಲ. ಆದ್ದರಿಂದ,
ಪ್ರಿಯರಿ (priory) ತಿಳಿಯಲು
ಒಂದು ಮಾರ್ಗವಿದೆಯೇ?
ಒಳ್ಳೆಯದು, ದುರದೃಷ್ಟವಶಾತ್,
ದತ್ತಾಂಶವು ನಿರ್ಣಾಯಕ
ಅಥವಾ ಸಂಭವನೀಯ ಪ್ರಕ್ರಿಯೆಯಿಂದ
ಹೊರಬರುತ್ತದೆಯೆ ಎಂದು

Gujarati: 
કાઢ્યું છે કે તે
અમારા સંશોધન કાર્યનો
એક ભાગ છે કે નહીં.
તે આપણા માનવ સ્વાસ્થ્ય

Hindi: 
के पहले के बारे में
बात की थी।
अगर मैं समय के साथ
एक सेंसर के साथ सौ
अवलोकन एकत्र करता
हूं, तो एक और सेंसर
इसे अलग तरीके से
देखता; ताकि, एक और
डेटा रिकॉर्ड असंभव
हो सकता है या एक ही
सेंसर स्वयं रिकॉर्ड
हो सकता था, जो भी
स्थिर रहता है वह
पूरी तरह से अलग-अलग
मूल्यों को रिकॉर्ड
कर सकता था।
इसलिए, उन सभी संभावित
मूल्यों को समझना
संभव नहीं है, लेकिन
सैद्धांतिक (THEORETICAL)
रूप से यह सभी संभव
स्थान की कल्पना
करना महत्वपूर्ण
है और हम इसे आबादी
के रूप में कहते हैं
जिसका हम एक सैंपल
प्राप्त करते हैं।
ज तो यह एक अवलोकन
नहीं है, आंकड़ों
में एक सैंपल आम तौर
पर अवलोकनों का संग्रह
करता है।
यह मूल रूप से एक डेटा
रिकॉर्ड को संदर्भित
करता है, लेकिन सिग्नल
प्रोसेसिंग में,
नमूना एक पल में एक
मूल्य हो सकता है
और यह निर्धारक दुनिया
में है।
इस आबादी और नमूना
के अनुरूप हमारे
पास एक सत्य और अनुमान
है।
हमने अभी कहा है कि
जनसंख्या सभी संभावनाओं

Bengali: 
সাহিত্যে পাওয়া
যায় এমন কয়েকটি
শ্রেণীবিন্যাস আছে।
আমি এখানে তালিকাভুক্ত
কোন উপায় সম্পূর্ণ
না হয়।
আপনি দেখতে বিশ্লেষণের
সাধারণ ক্লাসিফিকেশন
এক অনুসন্ধানকারী
আয়াত নিশ্চিত হয়।
বিশ্লেষণের একটি
অনুসন্ধানমূলক প্রকারে,
আপনি কিছুটা পূর্বের
মতামত প্রকাশ করেন
না, তবে আপনি কেবল
তথ্য অনুসন্ধান করছেন

Marathi: 
मी येथे नमूना सांगतो
तेव्हा हे एक निरीक्षण
नाही, आकडेवारीमधील
एक नमुना म्हणजे
विशेषत: निरिक्षण
संग्रह.
हे मूलतः एका डेटा
रेकॉर्डचा संदर्भ
देते, परंतु सिग्नल
प्रोसेसिंगमध्ये,
तत्काळ एक नमुना
एक मूल्य असू शकतो
आणि ते नियतनवाचक
जगात आहे. या लोकसंख्येशी
आणि नमुना प्रमाणे
आम्ही एक सत्य आणि
एक अनुमान आहे. आम्ही
आत्ताच म्हटले आहे
की लोकसंख्या ही
सर्व शक्यतांचे संकलन
आहे, परंतु ती सत्यतेची
वैशिष्ट्ये आहे.
म्हणून, ही संपूर्ण
लोकसंख्या आहे, उदाहरणार्थ,
विशिष्ट अर्थ. आम्हाला
असे सांगू या की, मी
एका वयोगटाच्या सरासरी
पगाराकडे पाहत आहे
- एका मोठ्या देशात,
आम्हाला सांगा किंवा
खूप मोठ्या फर्ममध्ये
माझ्यासाठी जाणे
आणि प्रत्येकजण विचारणे
शक्य नाही. व्यावहारिक
कारणांसाठी, मी फक्त
काही लोकांना त्यांच्या
वेतन बद्दल ही माहिती
गोळा करण्यासाठी
विचारू शकते आणि
ज्यावरून मी खऱ्या
सरासरी पगाराचे अनुमान
काढतो.
तर, खऱ्या सरासरी
पगाराची एक सत्य

Tamil: 
செயல்முறையின் போதுமான
புரிதலை எனக்குக்
கிடையாது என்று ஒரு
முறையான வழி. ஆனால்
நான் ஒரு கலவையான
வழக்கு கொண்டிருக்கும்
சூழல்களும் உள்ளன
- இதில் ஒரு செயல்முறையின்
ஒரு பகுதியை நான்
நன்றாக அறிந்திருக்கிறேன்
மற்றும் செயல்முறையின்
மற்ற பகுதி எனக்கு
அப்பால் உள்ளது.
நாம் எங்கே தீர்மானகரமான
மற்றும் சீரற்ற செயல்முறை
கலவை உள்ளது.
பொறியியல் நடைமுறையில்
இது மிகவும் பொதுவானது,
ஏனென்றால் முன்னர்
நாங்கள் விவாதித்த
அணு உலை மாதிரி போலவே,
ஒரு உடல் செயல்முறை
நன்கு புரிந்து கொள்ளப்படலாம்,
ஆனால் சென்சார் (sensor)
அல்லது ஆன்எபக்ட்டிவ்
டிஸ்டுர்பக்ஸ் (unffective
disturbances) இன் சில விளைவுகள்,
என் கட்டுப்பாட்டிற்கு
அப்பாற்பட்ட ஒன்று,
அவை தற்செயலாக நடத்தப்பட
வேண்டும் நான் அவர்களை
துல்லியமாக கணிக்க
முடியாது என்பதால்.
எனவே, அங்கு தீர்மானகரமான
மற்றும் முரண்பாடான
கருத்துக்கள் இரண்டையும்
சமாளிக்க வேண்டியிருக்கலாம்,
மேலும் நீங்கள் அதை
செய்ய அனுமதிக்கும்
ஒரு கோட்பாடு உள்ளது.
எனவே, கீழே வரி தயவு
செய்து ஒரு சில நிமிடங்கள்
செலவழிக்க விரும்புகிறேன்
- முதலில் ஒரு நிர்ணயிக்கப்பட்ட
தரவை நீங்கள் நிர்ணயிக்க
விரும்பினால், ஒரு
தீர்மானமான அல்லது
சீரற்ற செயல் அல்லது
ஒரு கலவையான செயல்முறையிலிருந்து
வெளியே வர வேண்டும்.
நீங்கள் அந்த கருத்தை
உருவாக்கியிருக்கிறீர்கள்,
ஏனென்றால் பகுப்பாய்வு
நிச்சயமாக உண்மையில்
அது சார்ந்திருக்கிறது.

English: 
sample we have a truth and an estimate. We
just said population is a collection of all
possibilities, but that’s characterized
by the truth.
So, this entire population has, for example,
certain mean. Let us say, I am looking at
the average salary of a group - of an age
group - in a very large country, let us say
or in very large firm. It’s not possible
for me to go and ask every one. For practical
reasons, I may only select a few people to
ask to collect this information about their
salary and from which I infer the true average
salary. So, the true average salary is a truth,
that is what characterizes the population
- that age group - and estimate is what I
obtain from data. Obviously, estimate will
always be different from truth because I have
not seen all possibilities. And the estimation
theory tells you how to estimate the parameter

Bengali: 
এবং আপনার প্রক্রিয়াটি
বুঝতে চেষ্টা করছেন।
উদাহরণস্বরূপ, এটি
মধ্যম বা আদর্শ বিচ্যুতির
দিকে নজর দিতে পারে
অথবা গ্রাফগুলির
দিকে তাকিয়ে দেখতে
পারে, প্রক্রিয়াটি
রৈখিক বা লেখার মতো
কিনা তা বোঝার চেষ্টা
করা; প্রক্রিয়া
oscillatory হয় কিনা বুঝতে
চেষ্টা।
অনেক ভিজুয়াল প্লাস
কিছু বর্ণনামূলক

Gujarati: 
સાથે સંકળાયેલો છે
અને જો તમે ઇસીજી
યાદ કરો તો ટ્રેન
છે, તે એક પલ્સનું

Kannada: 
ಕಂಡುಹಿಡಿಯಲು ನಿಮಗೆ
ಯಾವುದೇ ಪರಿಪೂರ್ಣ
ಸೂತ್ರವಿಲ್ಲ; ಆದರೆ
ನಿಮಗೆ ತಿಳಿದಿಲ್ಲದಿರುವಷ್ಟು
ಆ ಪ್ರಕ್ರಿಯೆಯ ಬಗ್ಗೆ
ನಿಮಗೆ ತಿಳಿದಿರಬೇಕು.
ಉದಾಹರಣೆಯಾಗಿ, ನಾನು
ಒಂದು ಕೋಣೆಯಲ್ಲಿ ಹಿಡಿಯುತ್ತಿದ್ದೇನೆ,
ಅಲ್ಲಿ ಸಾಕಷ್ಟು ಗಾಳಿ
ಇಲ್ಲ. ಗಾಳಿಯು ಇನ್ನೂ
ಚೆನ್ನಾಗಿರುತ್ತದೆ
ಮತ್ತು ನಾನು ಚೆಂಡನ್ನು
ಬಿಡಲು ಹೋಗುತ್ತೇನೆ.
ಚೆಂಡನ್ನು ನೆಲದ ಮೇಲೆ
ಹೊಡೆಯಲು ಎಷ್ಟು ಸಮಯ
ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ
ಎಂಬುದನ್ನು ಭೌತಶಾಸ್ತ್ರದ
ಸಹಾಯದಿಂದ ನಾವು ಬಹಳವಾಗಿ
ತಿಳಿಯಬಹುದು.
ಇದು ಸಾಕಷ್ಟು ನಿರ್ಣಾಯಕ
ಪ್ರಕ್ರಿಯೆಯಾಗಿದೆ.
ಅಲ್ಲಿ ತುಂಬಾ ಅನಿಶ್ಚಿತತೆ
ಇಲ್ಲ. ಮತ್ತೊಂದೆಡೆ
ನಾಳೆ ಮಳೆಯಾಗಲಿ ಅಥವಾ
6 ತಿಂಗಳಲ್ಲಿ ಮಳೆಯಾಗಲಿದೆಯೆ
ಅಥವಾ ನಾನು ಯಾವುದೇ
ಇತರ ವಾತಾವರಣ ಪ್ರಕ್ರಿಯೆಯ
ಗುಣಲಕ್ಷಣಗಳನ್ನು
ಅಥವಾ ಆರ್ಥಿಕ ಪ್ರಕ್ರಿಯೆಯನ್ನೂ

Marathi: 
आहे, तीच लोकसंख्येचे
लक्षण आहे - त्या वयोगटाचे
- आणि मला डेटावरून
मिळणारे अनुमान.
स्पष्टपणे, अंदाज
नेहमी सत्यापेक्षा
भिन्न असणार आहे
कारण मी सर्व संभावना
पाहिल्या नाहीत.
आणि अंदाज सिद्धांत
आपल्याला सांगते
की डेटाद्वारे एका
कार्यक्षम सुसंगत
पद्धतीने व्याज पॅरिमचा
अंदाज कसा लावावा.
यासह संबद्ध, आमच्याकडे
असा अंदाज आहे. आपण
या अटी सांख्यिक
आणि अंदाज म्हणतात.
आकडेवारी आपल्या
निरिक्षणांच्या
गणिती कार्याशिवाय
दुसरे काहीही नाही.
पुन्हा, नमुना म्हणजे
एक सांख्यिकी आहे;
नमुना फरक एक आकडेवारी
आहे. हे फक्त आपण गणिताचे
निरिक्षण करत आहात
हे गणितीय ऑपरेशन
आहे. एक अंदाजपत्रक
देखील एक गणिती फंक्शन
आहे. आपण असे म्हणू
शकता की हे सॉफ्ट
उपकरण किंवा वर्च्युअल
डिव्हाइस आहे जे
एका गणिती पद्धतीने
डेटावर कार्य करते
आणि आपल्याला काय
अपेक्षित आहे याचा
अंदाज लावते.
आकडेवारी आणि अंदाजपत्रकामधील
फरक अगदी सुटेल आहे.

Hindi: 
का संग्रह है, लेकिन
यह सत्य द्वारा विशेषता
है।
इसलिए, इस पूरे आबादी
के लिए, उदाहरण के
लिए, कुछ मतलब है।
आइए हम कहें, मैं एक
समूह के औसत वेतन
को देख रहा हूं - एक
बहुत बड़े देश में,
हम कहें या बहुत बड़ी
फर्म में।
मेरे लिए हर किसी
से पूछना संभव नहीं
है।
व्यावहारिक कारणों
से, मैं केवल कुछ लोगों
को अपने वेतन के बारे
में जानकारी एकत्र
करने के लिए कह सकता
हूं और जिनसे मैं
सही औसत वेतन का अनुमान
लगाता हूं।
इसलिए, वास्तविक
औसत वेतन एक सत्य
है, जो कि जनसंख्या
को दर्शाता है - वह
आयु समूह - और अनुमान
डेटा से प्राप्त
होता है।
जाहिर है, अनुमान
हमेशा सत्य से अलग
होगा क्योंकि मैंने
सभी संभावनाओं को
नहीं देखा है।
और अनुमान सिद्धांत
आपको बताता है कि
रिकॉर्ड किए गए डेटा
से, एक कुशल निरंतर
तरीके से ब्याज के
पैरामीटर का अनुमान
कैसे लगाया जाए।
इसके साथ संबद्ध,
हमारे पास यह अनुमान
है।
आपके पास सांख्यिकीय
और अनुमानक नामक
शब्द हैं।
एक आंकड़ा आपके अवलोकनों
के गणितीय कार्य

Malayalam: 
അതുകൊണ്ട്, യഥാര്‍ത്ഥ
ശരാശരി ശമ്പളം ഒരു
സത്യമാണ്.
ആ പ്രായപരിധിയിലുള്ള
ഒരു കൂട്ടം ആളുകളാണ്
population നിര്‍ണ്ണയിക്കുന്നത്.
ഡാറ്റയില്‍ നിന്നും
എനിക്ക് കിട്ടിയത്
കണക്കുകൂട്ടലാണ്.
എല്ലായ്പ്പോഴും
കണക്കുകൂട്ടലുകള്‍
സത്യത്തില്‍ നിന്ന്
വ്യത്യസ്തമായിരിക്കും.
കാരണം നമ്മള്‍ എല്ലാ
സാധ്യതകളും പരിഗണിച്ചിട്ടില്ല.
എസ്റ്റിമേറ്റ് സിദ്ധാന്തം
പറയുന്നു: എങ്ങനെ
ഡാറ്റയില്‍ നിന്ന്
കാര്യക്ഷമമായ രീതിയില്‍
പലിശ കണക്കാക്കാം.
ഇതുമായി കണക്കുകൂട്ടലുകള്‍
ബന്ധപ്പെട്ടിരിക്കുന്നു.
ഇതുമായി ബന്ധപ്പെട്ട
പദങ്ങളാണ് statisctical and
estimator.. നിങ്ങളുടെ നിരീക്ഷണങ്ങളുടെ
ഗണിതശാസ്ത്രപരമായ
ഒരു പ്രവൃത്തിയാണ്
statistic.
വീണ്ടും, സാമ്പിള്‍
mean and variance സ്റ്റാറ്റിസ്റ്റിക്
ആണ്. നിങ്ങള്‍ നിരീക്ഷണങ്ങളില്‍
ചെയ്യുന്ന ലളിതമായ
ഒരു ഗണിത പ്രവര്‍ത്തനം
മാത്രമാണ്.
ഒരു എസ്റ്റിമേറ്റര്‍
ഒരു ഗണിതഫങ്ഷനാണ്.
ഒരു ഗണിതശാസ്ത്രപരമായ
രീതിയില്‍ ഡാറ്റയില്‍
പ്രവര്‍ത്തിക്കുന്നതിനും
നിങ്ങള്‍ക്ക് കണക്കുകൂട്ടലുകള്‍
നടത്തുന്നതിനുമുള്ള
ഒരു ഉപാധി അല്ലെങ്കില്‍
വെര്‍ച്ച്വല്‍ ഡിവൈസാണിത്.
സ്റ്റാറ്റിസ്റ്റിക്സും
എസ്റ്റിമേറ്ററും
തമ്മിലുള്ള വ്യത്യാസം
വളരെ സുതാര്യമാണ്.
പ്രഥമവീക്ഷണം അവര്‍
ഒന്നുതന്നെയാണെന്ന്
തോന്നും.
പക്ഷേ സ്റ്റാറ്റിസ്റ്റിക്
എന്നത് ഒരു ഉദ്ദേശ്യത്തിനുവേണ്ടി

Hindi: 
के अलावा कुछ भी नहीं
है।
फिर, नमूना मतलब एक
आंकड़ा है; नमूना
भिन्नता एक आंकड़ा
है।
यह केवल एक गणितीय
ऑपरेशन है जिसे आप
अवलोकनों पर कर रहे
हैं।
एक अनुमानक भी गणितीय
कार्य है।
आप कह सकते हैं कि
यह एक सॉफ्ट डिवाइस
या वर्चुअल डिवाइस
है जो गणितीय तरीके
से डेटा पर काम करता
है और आपको जो चाहिए
वह अनुमान लगाता
है।
आंकड़े और अनुमानक
के बीच का अंतर काफी
सूक्ष्म है।
सबसे पहले वे एक जैसा
दिखते हैं, लेकिन
अंतर यह है कि आंकड़े
केवल एक गणितीय कार्य
है जो किसी भी उद्देश्य
के लिए आवश्यक नहीं
है; जबकि, एक अनुमानक
एक गणितीय ऑपरेशन
है जो किसी दिमाग
में कुछ अनुमान लगाने
के विशिष्ट उद्देश्य
के साथ किया जाता
है।
इसलिए, यदि आप आकलन
सिद्धांत में आगे
जाते हैं, तो आप सांख्यिकीय
और अनुमानक के बीच
इस अंतर पर अधिक चर्चा
देखेंगे, लेकिन जहां
तक ​​गणितीय परिचालन,
डेटा के गणितीय कार्य
दोनों ही हैं।
तो, अनुमान सिद्धांत
में, हम अक्सर आंकड़ों
और अनुमानकों का
उपयोग करते हैं।

Bengali: 
পরিসংখ্যান বিশ্লেষণ
জড়িত আছে; যখন নিশ্চল
বিশ্লেষণে আপনার
কাছে একটি প্রাতিষ্ঠানিক
আবেদন আছে, এবং আপনি
কি আপনার মনে আছে
কি সঠিক কিনা তা নিশ্চিত
করতে ডেটা ব্যবহার
করবেন।
সুতরাং, স্পষ্টতই,
সেখানে একটি বিট
বিপরীতে আছে।
এবং তারপর, আপনি পরিমাণগত
আয়াত গুণগত তথ্য
বিশ্লেষণ আছে।

Gujarati: 
ટ્રેન છે જે તેમાં
નિયમિત શિખરો ધરાવે
છે અને અમે તે લક્ષણોને
કાઢવા માંગીએ છીએ.
ઇસીજી પર જે જુએ છે
તે ડોકટર આવશ્યકપણે

Kannada: 
ನೋಡಿದರೆ ಮತ್ತು ಸಂವೇದಕ
ಶಬ್ದವನ್ನು ಹೀಗೆ ನೋಡಿದರೆ
ನಾನು ಕೇಳಬೇಕಾದರೆ
ಮೇಲೆ, ಸಂವೇದಕದಲ್ಲಿನ
ದೋಷದ ಮುಂದಿನ ಮೌಲ್ಯ
ಏನು ಎಂದು ಊಹಿಸಲು
ತುಂಬಾ ಕಷ್ಟ. ಅಂತಹ
ಸಂದರ್ಭಗಳಲ್ಲಿ, ನಾವು
ಸಂಭವನೀಯತೆ ಸಿದ್ಧಾಂತದಲ್ಲಿ
ಆಶ್ರಯ ಪಡೆದುಕೊಳ್ಳುತ್ತೇವೆ
ಮತ್ತು ಈ ಪ್ರಕ್ರಿಯೆಯ
ಬಗ್ಗೆ ನನಗೆ ಪರಿಪೂರ್ಣ
ಜ್ಞಾನವಿಲ್ಲ ಎಂದು
ನಾವು ಹೇಳುತ್ತೇವೆ.
ಆದ್ದರಿಂದ, ಅನೇಕ ಸಾಧ್ಯತೆಗಳಿವೆ
ಎಂದು ನಾನು ಭಾವಿಸುತ್ತೇನೆ,
ಮತ್ತು ಆ ಸಾಧ್ಯತೆಗಳಿಗೆ
ಪ್ರತಿಯೊಂದು ಅವಕಾಶಗಳನ್ನು
ನಿಯೋಜಿಸುತ್ತೇನೆ.
ಸಂಭವನೀಯತೆ ಸಿದ್ಧಾಂತವು
ಜನನವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ,
ಮತ್ತು ಅಲ್ಲಿ ಸಮಯ
ಸರಣಿಯ ವಿಶ್ಲೇಷಣೆಯು
ಒಳಗೊಳ್ಳುತ್ತದೆ.
ಅಲ್ಲಿ ನೀವು ಊಹಿಸಬೇಕಾದ
ಇನ್ನೊಂದು ಪರಿಸ್ಥಿತಿ
ಇದೆ ಪ್ರಕ್ರಿಯೆಯು
ಸಂಭವನೀಯವಾಗಿದೆ ಮತ್ತು

Malayalam: 
മാത്രമായി രൂപപ്പെടാത്ത
ഒരു ഗണിതപ്രവര്‍ത്തനമാണ്.
ഒരു എസ്റ്റിമേറ്റര്‍
മനസ്സില്‍ എന്തെങ്കിലും
വിലയിരുത്താന്‍
ഒരു പ്രത്യേക ഉദ്ദേശത്തോടെയുള്ള
ഒരു ഗണിതശാസ്ത്രപ്രക്രിയയാണ്.
അതിനാല്‍, നിങ്ങള്‍
എസ്റ്റിമേഷന്‍ സിദ്ധാന്തത്തില്‍
കൂടുതല്‍ ആഴത്തില്‍
ഇറങ്ങുകയാണെങ്കില്‍,
സ്റ്റാറ്റിസ്റ്റിക്സും
എസ്റ്റിമേറ്ററും
തമ്മിലുള്ള ഈ വ്യത്യാസത്തെക്കുറിച്ച്
കൂടുതല്‍ ചര്‍ച്ചകള്‍
കാണും.
പക്ഷേ രണ്ടും ഡാറ്റയുടെ
ഗണിതശാസ്ത്രപരമായ
ഫങ്ഷനുകളാണ്.
അങ്ങനെ, മൂല്യനിര്‍ണ്ണയ
സിദ്ധാന്തത്തില്‍,
ഞങ്ങള്‍ പലപ്പോഴും
സ്റ്റാസ്റ്റിസ്റ്റിക്സും
എസ്റ്റിമേറ്ററും
ഉപയോഗിക്കുന്നു.
അതിനാല്‍,sample mean ഒരു
സ്റ്റാറ്റിസ്റ്റിക്സും
എസ്റ്റിമേറ്ററുമാണ്.
കാരണം യഥാര്‍ത്ഥ
ശരാശരി കണക്കാക്കാനും
വീണ്ടും ബന്ധിപ്പിക്കാനും
സാമ്പിള്‍ ഉദ്ധരിക്കപ്പെടുന്നു.
ഇതെല്ലാം population and sample
ആയി ബന്ധപ്പെട്ടതാണ്.
നിങ്ങള്‍ക്ക് ensemble
and sample ശരാശരികളുണ്ട്.
ഋിലൊയഹല മ്ലൃമഴല
എന്നാല്‍ നിങ്ങള്‍
തീര്‍ച്ചയായും കണ്ടിട്ടില്ലാത്ത
സാധ്യമായ എല്ലാ മൂല്യങ്ങളില്‍
നിന്നും കണക്കുകൂട്ടുന്ന
ശരാശരിയാണ്.
തീര്‍ച്ചയായും അത്
നമുക്ക് ഒരിക്കലും
കാണാന്‍ കഴിയില്ല.

English: 
of interest, in an efficient consistent way,
from the data recorded. Associated with this,
we have this estimation. You have this terms
called statistical and estimatior. A statistic
is nothing but a mathematical function of
your observations. Again, the sample mean
is a statistic; sample variance is a statistic.
It’s simply a mathematical operation that
you are performing on the observations. An
estimator is also a mathematical function.
You can say it’s a soft device or virtual
device that operates on the data in a mathematical
way and gets you an estimate of what you want.
The difference between statistic and estimator
is fairly suttle. Prima facie they appear
to be the same, but the difference is, statistic
is merely a mathematical function not necessarily
devised for any purpose; whereas, an estimator

Marathi: 
प्रथम दृष्ट्या ते
एकच असल्याचे दिसत
आहे, परंतु फरक असा
आहे, आकडेवारी केवळ
कोणत्याही हेतूसाठी
तयार केलेला गणिती
फंक्शन नाही; तर, अंदाजपत्रक
एक गणितीय क्रिया
आहे जो एखाद्या विशिष्ट
गोष्टीचा अंदाज घेऊन
विशिष्ट गोष्टीसह
अंदाज लावला जातो.
म्हणून, आपण अंदाज
सिध्दांत अधिक खाली
आला तर, आपण आकडेवारी
आणि अंदाजपत्रकामध्ये
या फरशावर अधिक चर्चा
पहाल, परंतु जेथे
गणितीय ऑपरेशन आहेत,
ते दोन्ही डेटाचे
गणितीय कार्य आहेत.
तर, अंदाज सिध्दांत,
आम्ही अनेकदा आकडेवारी
आणि अंदाजे वापर
करतो. तर, नमुना अर्थ
एक अर्थपूर्ण आणि
अचूक उदार मानणारा
अंदाजकार आहे, कारण
खरे माध्यचे अनुमान
लावण्यासाठी नमुना
अर्थ आखला आहे आणि
पुन्हा संबंधित आहे;
जसे आपण पाहू शकता
की हे सर्व लोकसंख्या
आणि नमुना बद्दल
आहे; आपल्याकडे साप्ताहिक
आणि नमूना सरासरी
आहेत
एन्सेबल सरासरी सरासरी
आहे जे आपण सर्व शक्य
मूल्यांमधून मोजू
शकता जे आपण कधीही

Tamil: 
சரி, அதனால் தான்,
தீர்மானிக்க வேண்டியது
என்னவென்றால், தரவு
ஏன் நிர்ணயிக்கப்படாமல்
இருப்பது என்பது
தெளிவாக உள்ளது,
குறிப்பாக இது மிகவும்
பொதுவான கருத்தாகும்;
உண்மையில், அநேக
ஆராய்ச்சியாளர்கள்
தரவு பகுப்பாய்வை
செய்து தரவு ஒரு
பகுதியை எடுத்துக்கொள்வதால்,
ஏன் ஒரு தருணத்திற்காக
இடைநிறுத்தப்படாமலும்,
ஏன், எந்த விதமான
சீரற்ற தன்மையும்
கேட்கக்கூடாது.
நான் ஒரு சீரற்ற
செயல்முறை வெளியே
வரும் தரவு கருதப்படுகிறது
தான், நான் வெறுமனே
போய் என் தரவு பகுப்பாய்வு
முன்னெடுக்க முடியாது.
சீரற்ற செயல்முறைகளில்,
பல வகைப்பாடுகளும்
உள்ளன, மேலும் என்
அனுமானத்தில் தெளிவாக
இருக்க வேண்டும்.
இது ஒரு ஊகத்திற்கு
பிறகு, ஆனால் இன்னும்
அது ஒரு எழுதுபொருள்
சீரற்ற செயல்முறை,
அல்லாத எழுதுபொருள்
சீரற்ற செயல்முறை
அல்லது ஒரு அவ்வப்போது
சீரற்ற செயல்முறை
வெளியே வருகிறது
என்பதை தெளிவாக இருக்க
வேண்டும்.
எனவே, வெவ்வேறு பிரிவுகள்
உள்ளன மற்றும் நாம்
மிகவும் தெளிவாக
இருக்க வேண்டும்.
இந்த அனைத்து பற்றி
சிந்திக்க வேண்டும்
என்று வழக்கமான வகைப்பாடு
உள்ளது.
இது தரவு ஒரு நிலையான
மாநில அல்லது மாறும்
செயல்முறை வெளியே
வருகிறது என்பதை,
நேரியல் அல்லாத நேர்கோட்டு.
இன்னும் அனைவருமே
நல்லவர்களாக இருக்கிறார்கள்,
ஆனால் நீங்கள் வெளிப்படையாக
செய்ய வேண்டிய மிக
முக்கியமான வகைப்பாடு
இதுதான்.
பொதுவாக, நீங்கள்
பரிசோதனைக்கு அணுகல்

Kannada: 
ನೀವು ನೋಡುವ ಡೇಟಾದ
ಕಾರಣವು ತಿಳಿದಿಲ್ಲವಾದ್ದರಿಂದ
ಆ ಪರಿಸ್ಥಿತಿ ಇರುತ್ತದೆ.
ಆದ್ದರಿಂದ, ಒಂದು ಸರಳ
ಉದಾಹರಣೆಯಂತೆ, ನಾನು
ಸ್ಟಾಕ್ ಮಾರುಕಟ್ಟೆ
ಸೂಚಿಯ ಭವಿಷ್ಯವನ್ನು
ನೋಡುತ್ತಿದ್ದೇನೆ.
ನಿಜವಾಗಿ ಪರಿಣಾಮ ಬೀರುವ
ಅನೇಕ ಕಾರಣಗಳಿವೆ;
ಸ್ಟಾಕ್ ಮಾರುಕಟ್ಟೆ
ಸೂಚ್ಯಂಕಕ್ಕೆ ಹಲವು
ಅಂಶಗಳು ಜವಾಬ್ದಾರವಾಗಿವೆ.
ಈಗ, ದುರದೃಷ್ಟವಶಾತ್,
ನಾನು ಕಾರಣಗಳನ್ನು
ತಿಳಿದಿದ್ದರೂ ಸಹ,
ನಾನು ಅವುಗಳನ್ನು ಅಳೆಯಲು
ಸಾಧ್ಯವಾಗದೆ ಇರಬಹುದು
ಮತ್ತು ಕೆಲವೊಮ್ಮೆ
ನಾನು ಸಾಕಷ್ಟು ಅಂಶಗಳನ್ನು
ಸಾಕಷ್ಟು ತಿಳಿದಿಲ್ಲ.
ಆದ್ದರಿಂದ, ನಾನು ಏನು
ಮಾಡಬೇಕು?
ನಾನು ಇತಿಹಾಸವನ್ನು
ಅವಲಂಬಿಸಿ, ಮತ್ತು
ಇತಿಹಾಸವು ಅದರಲ್ಲಿ
ಕೆಲವು ಖ್ಯಾತಿಯನ್ನು
ಹೊಂದಿದೆ ಎಂದು ಭಾವಿಸುತ್ತೇನೆ,
ಮತ್ತು ನಾನು ಐತಿಹಾಸಿಕ

English: 
is a mathematical operation that is carried
out with a specific purpose of estimating
something in mind okay.
So, if you go down further in the estimation
theory, you will see more discussion on this
difference between statistic and estimator,
but as far as the mathematical operation,
both are the mathematical functions of the
data. So, in estimation theory, we use the
statistics and estimators quite often. So,
sample mean is both a statistic and an estimator
of the true mean alright, because sample mean
is devised for estimating the true mean, and
again associated; as you can see it’s all
about the population and sample; you have
ensemble and sample averages.
Ensemble average is the average that you would
compute from all possible values that you
could have ever seen, which, of course, we
never get to see; in most of the situations

Bengali: 
গুণগত বিশ্লেষণে
উদাহরণস্বরূপ, আপনি
প্রবণতাগুলি দেখেন;
আপনি নির্দিষ্ট বৈশিষ্ট্য
এবং oscillatory বৈশিষ্ট্য
জন্য অনুসন্ধান করা
হয়, উদাহরণস্বরূপ।
যদিও, পরিমাণগত আপনি
হচ্ছে ... আপনি আপনার
বিশ্লেষণ থেকে সংখ্যাসূচক
ফলাফল এ খুঁজছেন।
তারপর, আপনার কিছু
বর্ণনামূলক আয়াত
বলা হয়েছে।

Marathi: 
पाहू शकले नाहीत,
अर्थातच, आम्ही कधीही
पाहू शकत नाही; बर्याच
परिस्थितीमध्ये
आम्ही सर्व शक्य
डेटा रेकॉर्ड गोळा
करू शकत नाही किंवा
वेतन उदाहरणामध्ये,
शक्य तितक्या वेळा
सर्व शक्य लोकांना
डेटा गोळा करणे शक्य
होणार नाही, अर्थातच,
सरासरी सरासरी मोजले
जाते. या नमुन्यांमधून.
आणि या सरासरीमध्ये
एर्गोदिक प्रक्रिया
म्हणून ओळखले जाणारे
परिभाषित करण्यासाठी
आणि इतकेच वापरले
जाते; आम्ही त्या
मध्ये जाणार नाही
शेवटी, दोन शब्द पूर्वाग्रह
आणि परिवर्तनशीलता
डेटा विश्लेषणामध्ये
फार महत्वाच्या आहेत
कारण ते दोन्ही त्रुटीबद्दल
चर्चा करतात ज्यामुळे
काही पॅरामीटर किंवा
पॅरामीटरचा संच तयार
होतो. बायस एक पद्धतशीर
त्रुटी आहे जो एक
तयार करतो; प्रत्येक
अंदाज व्यायाम आपल्याला
त्रुटीमध्ये अंदाज
देईल; यात काही शंका
नाही. प्रश्न हा अंदाज
आणि सत्य यांच्यातील
फरक आहे किंवा आपल्या
अंदाजाप्रमाणे काही
कमतरता किंवा त्रुटीमुळे

Gujarati: 
તે શિખરોની શોધ કરે
છે, અને તે શિખરોમાં
ફેરફારો પણ શોધે
છે, અને તે ફેરફારો

Hindi: 
तो, नमूना मतलब एक
वास्तविक और सही
अर्थ का अनुमानक
दोनों है, क्योंकि
नमूना मतलब वास्तविक
अर्थ का आकलन करने
के लिए तैयार किया
गया है, और फिर से
जुड़ा हुआ है; जैसा
कि आप इसे आबादी और
नमूना के बारे में
सब कुछ देख सकते हैं;
आपके पास ensemble और नमूना
औसत है।
औसतन औसत औसत है कि
आप उन सभी संभावित
मूल्यों से गणना
करेंगे जिन्हें आपने
कभी देखा होगा, जो
कि, हम निश्चित रूप
से कभी नहीं देख पाएंगे;
ज्यादातर स्थितियों
में हम सभी संभावित
डेटा रिकॉर्ड एकत्र
नहीं करते हैं या
वेतन उदाहरण में,
सार्थक समय में सभी
संभावित लोगों से
डेटा एकत्र करना
संभव नहीं हो सकता
है, नमूना औसत, निश्चित
रूप से, औसत औसत गणना
की जाती है इन नमूनों
से।
और इन औसत का उपयोग
परिभाषित करने के
लिए किया जाता है
जिसे एक एर्गोडिक
प्रक्रिया के रूप
में जाना जाता है
और इसी तरह; हम उसमें
नहीं जाएंगे।
अंत में, दो विश्लेषण
पूर्वाग्रह और परिवर्तनशीलता
डेटा विश्लेषण (DATA
ANALYSIS)में बहुत महत्वपूर्ण

Malayalam: 
സാധ്യമായ എല്ലാ ഡാറ്റ
റെക്കോര്‍ഡുകളും
ഞങ്ങള്‍ ശേഖരിക്കുന്നില്ല.
അല്ലെങ്കില്‍ ശമ്പള
ഉദാഹരണത്തില്‍, സാധ്യമായ
എല്ലാ ആളുകളില്‍നിന്നും
ഡാറ്റ അര്‍ത്ഥപൂര്‍ണ്ണമായ
സമയത്ത് ശേഖരിക്കാന്‍
സാധ്യമല്ല.
ഈ സാമ്പിളില്‍ നിന്ന്
ശരാശരി കണക്കാക്കപ്പെടുന്നതിനെയാണ്sample
മ്ലൃമഴല എന്നു പറയുന്നത്.
ഒരു ഈര്‍ഗോഡിക് പ്രക്രിയ
എന്നറിയപ്പെടുന്നവയെ
നിര്‍വ്വചിക്കാന്‍
ഈ ശരാശരി ഉപയോഗിക്കുന്നത്;
ഞങ്ങള്‍ അതിലേക്ക്
കടക്കുന്നില്ല.
അന്തിമമായി, രണ്ട്
പദങ്ങളായ bias and variability
വിശകലനങ്ങളില്‍
വളരെ പ്രധാനമാണ്.
കാരണം ചില പരാമീറ്റര്‍
അല്ലെങ്കില്‍ ഒരു
കൂട്ടം പരാമീറ്ററുകള്‍
കണക്കിലെടുക്കുന്നതില്‍
ഉണ്ടാകുന്ന തെറ്റിനെക്കുറിച്ച്
പറയാനാണ് ഇവയുപയോഗിക്കുന്നത്.
Bias കണക്കുകൂട്ടലിലുണ്ടാകുന്ന
ഒരു സിസ്റ്റമാറ്റിക്
പിശകാണ്; ഓരോ എസ്റ്റിമേഷനിലും
നിങ്ങള്‍ക്ക് ഒരു
പിഴവ് ഉണ്ടാകും.
അതില്‍ യാതൊരു സംശയവുമില്ല.
എസ്റ്റിമേറ്ററും
സത്യവും തമ്മിലുള്ള
വ്യത്യാസം യാദൃശ്ചികമോ
അല്ലെങ്കില്‍ നിങ്ങളുടെ
മതിപ്പുള്ളവയുടെ
കുറവുകളോ ആണ്. നിങ്ങളുടെ
എസ്റ്റിമേറ്റില്‍
ബയസുണ്ടെന്ന് എങ്ങനെ
അറിയാനാകും?
ഈ ചിന്താപ്രക്രിയ
സങ്കല്പിക്കുക; ഒരു

Tamil: 
இருந்தால், இது டேட்டா
அனாலிசிஸ் (Data Analysis)ன்
வெளிப்புறத்திற்கு
வெளியே உள்ளது, ஆனால்
அது உங்கள் பரிசோதனையின்
போது முடிந்தால்
சீரற்ற ஆதாரங்களை
அடக்குவது தொடர்பானது.
அது ஒரு பகுதியாகும்,
அது சோதனைகளின் வடிவமைப்பில்
விவரிக்கப்படும்
ஒரு தலைப்பகுதியாகும்,
அது இங்கே போகாதே.
மக்கள் பெரும்பாலும்
தவறவேயில்லை என்று
மிக முக்கியமான விஷயம்
- இது ஆரம்பமானது
- இது தரவுத்தளத்திலிருந்து
நான் எடுக்கும் எந்தவொரு
மதிப்பீடும் அல்லது
எந்தவிதமான அனுமானமும்
ஆகும் - பொதுவாக நிறைய
தரவு சீரற்ற அல்லது
ஒரு சீரற்ற செயல்பாட்டிலிருந்து
வெளியே வரப்படுகிறது;
அந்த மதிப்பீடுகள்
இயற்கையிலேயே சீரற்றதாக
இருக்கின்றன, ஏனென்றால்
அது நிச்சயமற்றதாக
இருக்கும் தரவு மூலம்
நீங்கள் போடுகிறீர்கள்.
சில வழிமுறைகள் மூலம்,
சில சூத்திரங்கள்,
சில கணித செயல்முறைகள்
மற்றும் நீங்கள்
வெளியே வருகிறீர்கள்,
எடுத்துக்காட்டாக,
நான் மாதிரி சராசரி
கணக்கிடுகிறேன்.
நான் ஒரு சென்சார்
(sensor) மூலம் தரவு, சுற்றுப்புற
வெப்பநிலை தரவு,
சென்று சேகரிக்க.
என் மேசைக்கு திரும்பவும்
என் கணினியில் அல்லது
என் கால்குலேட்டருக்குள்
(calculator) தரவைப் பதியவும்,
மாதிரி மதிப்பை நான்
கணக்கிடுகிறேன்.
மாதிரி நான் சராசரியாக
கணக்கிட்டுள்ளேன்
என்று அர்த்தம்;
என்ன சராசரியாக?
நிச்சயமற்ற நிலையில்
சிதைந்த டேட்டா (Data).
எனவே, அந்த நிச்சயமற்ற
தன்மைகள் உங்கள்
மாதிரியின் மூலம்
தங்கள் வழியைச் செய்துள்ளன.
எனவே, மாதிரி மதிப்பு
நீங்கள் சில நிச்சயமற்ற
உள்ளது என்று அர்த்தம்.

Malayalam: 
പ്രക്രിയയ്ക്കായി
100 ഡാറ്റ റെക്കോര്‍ഡുകള്‍
അല്ലെങ്കില്‍ ആയിരം
ഡാറ്റ റെക്കോര്‍ഡുകള്‍
ഞാന്‍ ശേഖരിച്ചു.
ഓരോ ഡാറ്റാ റിക്കോര്‍ഡുകളിലെയും
സാമ്പിള്‍ mean ഞാന്‍
കണക്കുകൂട്ടുന്നു.
ഞാന്‍ ആയിരക്കണക്കിന്
ശരാശരി കണക്കാക്കി
ഒരു ദശലക്ഷം സാധ്യതകള്‍
ഉണ്ടെങ്കില്‍, എനിക്ക്
സത്യം കണ്ടെത്താം.
എന്നാല്‍ ഈ ദശലക്ഷമാതൃക
ശരാശരി അല്ലെങ്കില്‍
സാമ്പിള്‍ means തമ്മില്‍
വ്യത്യാസമുണ്ടെങ്കില്‍
അതില്‍ ഒരു സിസ്റ്റമാറ്റിക്
error ഉണ്ട്.
ഞാന്‍ മുകളില്‍ പറഞ്ഞപോലെ,
ensemble ശരാശരി expectation എന്നും
അറിയപ്പെടുന്നു.
മറ്റൊരു വിധത്തില്‍
ബയസിനെപ്പറ്റി പറഞ്ഞാല്‍,
മൂല്യനിര്‍ണ്ണയത്തിന്‍റെ
പ്രതീക്ഷാമൂല്യം
സത്യത്തില്‍ നിന്ന്
വ്യത്യസ്തമാണെങ്കില്‍,
നാം കണക്കൂകുട്ടലില്‍
ഒരു ബയസ് ഉണ്ടെന്ന്
പറയുന്നു.
വേരിയബിളിനെക്കുറിച്ച്
പറയുകയാണെങ്കില്‍,
അത് വിവിധ ഡാറ്റാ
റെക്കോര്‍ഡിലുടനീളമുള്ള
കണക്കുകളുടെ വ്യാപ്തിയാണ്.
അത് വളരെ പ്രധാനമാണ്.
കാരണം ഞാന്‍ ഒരു
ഡാറ്റ റെക്കോര്‍ഡിനൊപ്പം
പ്രവര്‍ത്തിക്കുന്നു.
കൂടാതെ എന്‍റെ എല്ലാ
അനുമോദനങ്ങളും ഒരു

Gujarati: 
એ બિનઆરોગ્યપ્રદ
હૃદયના સંકેત હોઇ
શકે છે, ઉદાહરણ તરીકે.
તેથી, લક્ષણ નિષ્કર્ષણ
ખૂબ જ સામાન્ય છે,

Kannada: 
ಮಾದರಿಗಳು ಮತ್ತು ಪರಸ್ಪರ
ಸಂಬಂಧಗಳನ್ನು ಬಳಸಿಕೊಳ್ಳುತ್ತಿದ್ದೇನೆ
ಮತ್ತು ಮುನ್ಸೂಚನೆಯನ್ನು
ಮಾಡುತ್ತೇನೆ, ಆದರೆ
ಆ ಭವಿಷ್ಯವು ನಿಸ್ಸಂಶಯವಾಗಿ
ನಿಖರವಾಗಿಲ್ಲ.
ಇತಿಹಾಸವನ್ನು ನೋಡುವುದಕ್ಕಿಂತಲೂ
ಬಿಂದುವಿನ ಹೊರತಾಗಿ
ನಾವು ಈ ಮುಖ್ಯವಾದ
ಊಹೆಯೆಂದರೆ, ಈ ಸ್ಟಾಕ್
ಮಾರುಕಟ್ಟೆ ಪ್ರಕ್ರಿಯೆ
- ಇದು ಸೂಚ್ಯಂಕವನ್ನು
ಉತ್ಪಾದಿಸುವ ಕೆಲವು
ವಿಚಾರಾತ್ಮಕ ಪ್ರಕ್ರಿಯೆ
- ಯಾದೃಚ್ಛಿಕ ಸ್ವರೂಪದಲ್ಲಿದೆ.
ನಾನು ಅದನ್ನು ಗಮನಿಸುತ್ತಿರುವುದನ್ನು
ಸ್ಟಾಕ್ ಮಾರುಕಟ್ಟೆ
ಸೂಚಿಯ ಯಾವುದೇ ಮೌಲ್ಯವನ್ನು
ಹೊರಹಾಕಬಹುದು.
ಅದರಲ್ಲಿ ಹಲವು ಸಾಧ್ಯತೆಗಳಿವೆ.
ವಾಸ್ತವದಲ್ಲಿ ಇದು
ನಿಜವಲ್ಲ.
ನಿಜವಾದ ಪ್ರಕ್ರಿಯೆಯು
ಆ ರೀತಿ ವರ್ತಿಸುತ್ತಿಲ್ಲದಿರಬಹುದು;
ಅದು ನಾನು ಮಾಡುವ ಒಂದು
ಕಲ್ಪನೆಯಾಗಿದೆ, ಆದ್ದರಿಂದ
ದತ್ತಾಂಶ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಮುಂದುವರೆಯಲು; ಅದು
ತುಂಬಾ ಮುಖ್ಯವಾಗಿದೆ.
ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ,
ಪ್ರಕ್ರಿಯೆಯನ್ನು

Tamil: 
இங்கே உங்கள் நிச்சயமற்ற
தன்மை உங்கள் கணக்கீட்டில்
பிழை சரி இல்லை; அது
ஒதுக்கி வைக்கப்பட
வேண்டும்.
இந்த நிச்சயமற்ற
தன்மை, இந்த செயல்முறையின்
உண்மையான அர்த்தம்
என்றால் நிச்சயமாக
இல்லை என்பது உண்மைதான்;
அது நிச்சயமற்றது.
நீங்கள் சேகரித்த
டேட்டா (Data) இதுதான்
என்பதால் இது மீண்டும்
உள்ளது.
பல சேகரிக்கப்பட்ட
டேட்டா (Data)களில் ஒன்று
நீங்கள் சேகரித்திருக்கலாம்.
எனவே, நீங்கள் பெற
முடியும் என்று பல
சாத்தியமான மாதிரி
ஒன்று இது ஒரு மாதிரி
அர்த்தம் உள்ளது.
நீங்கள் சரிபார்ப்பு,
இடைமறித்தல் அல்லது
வேறு எந்த உறவுமுறையையும்
மதிப்பிடுகிறீர்களோ,
எந்தத் தரவரிசை மதிப்பீட்டிற்கும்
மதிப்பளிக்கிறதா
என்பதை இது வரையறுக்கிறது.
தரவுத்தளத்தில்
இருந்து நீங்கள்
மதிப்பீடு செய்யக்கூடிய
மற்ற சிக்கலான அளவுருக்கள்,
நீங்கள் ஒரு பிழை
உள்ளது என்பதை நினைவில்
கொள்ள வேண்டும்,
மேலும் ஆய்வாளர்,
மதிப்பீட்டின் அளவை
அல்லது மதிப்பீட்டில்
உள்ள நிச்சயமற்ற
அல்லது நீங்கள் வரைந்து
கொண்டிருக்கும்
அனுமானத்தை கணக்கிடுவதற்கான
ஆய்வாளரின் பொறுப்பாகும்.
இது தரவு பகுப்பாய்வு
மிக முக்கியமான பகுதியாகும்.
இந்த சூழலில், நீங்கள்
மதிப்பீடு முறை ஒன்றைத்
தேர்வு செய்ய வேண்டும்,
இது முடிந்தவரை சிறிய
பிழை என நீங்கள்
மதிப்பிடும், அதை
பற்றி விரிவாகப்
பேசுவோம்.
மேலும் முக்கியமாக
நீங்கள் இன்னும்
அதிகமான கண்காணிப்புகளை
சேகரித்து வருகையில்,

English: 
we never get to collect all the possible data
records or in the salary example, it may not
be possible to collect the data from all possible
people in meaningful time, Sample average,
of course, is simply the average is computed
from these samples. And these averages are
used to define what is known as an ergodic
process and so on; we will not go into that.
Finally, the two terms bias and variability
are very important in data analysis because
they both talk about the error that one makes
in estimating some parameter or a set of parameters.
Bias is a systematic error that one ends up
making; every estimation exercise will give
you an estimate that’s in error; there’s
no doubt about it. The question is whether
the difference between estimate and truth
is by chance or due to some deficiency or

Hindi: 
हैं क्योंकि वे दोनों
उस त्रुटि के बारे
में बात करते हैं
जो किसी को कुछ पैरामीटर
या पैरामीटर के सेट
का अनुमान लगाने
में बनाता है।
बाईस एक व्यवस्थित
त्रुटि है जो एक को
समाप्त होता है; प्रत्येक
अनुमान अभ्यास आपको
एक अनुमान देगा जो
त्रुटि में है; इसके
बारे में कोई संदेह
नहीं है।
सवाल यह है कि अनुमान
और सत्य के बीच का
अंतर मौका या आपके
अनुमानक की कमी या
कमी के कारण है।
आप कैसे जानते हैं
कि आपके आकलन अभ्यास
में या आपके अनुमान
में पूर्वाग्रह है
या नहीं?
इस विचार प्रक्रिया
की कल्पना करो; मैंने
एक प्रक्रिया के
लिए सौ डेटा रिकॉर्ड
या हजार डेटा रिकॉर्ड
एकत्र किए हैं, और
मैं प्रत्येक डेटा
रिकॉर्ड के लिए नमूना
माध्य की गणना करता
हूं।
यदि मैं औसत हूं, तो
हम कहें, हजारों डेटा
रिकॉर्ड के बारे
में हजारों डेटा
रिकॉर्ड नहीं, मेरे
पास एक नमूना मतलब
है; और लाख डेटा रिकॉर्ड
के लिए, इसलिए मेरे
पास लाख नमूना साधन
हैं।
यदि मैं नमूना का
औसत औसत करता हूं,

Marathi: 
आहे का असा प्रश्न
आहे. आपल्या अंदाज
वर्तनात किंवा आपल्या
अंदाजपत्रकात पूर्वाभिमुख
असेल तर आपल्याला
कसे कळेल?
ही विचार प्रक्रिया
कल्पना करा; मी संकलित
केले आहे एका डेटासाठी
शंभर डेटा रेकॉर्ड
किंवा हजार डेटा
रेकॉर्ड किंवा हजार
डेटा रेकॉर्ड सांगा,
आणि मी प्रत्येक
डेटा रेकॉर्डसाठी
नमून्याचा अर्थ गणना
करतो जर मी सरासरी
असेल तर आपण म्हणू,
हजारो नाही, दहा लाख
डेटा रेकॉर्ड, प्रत्येक
डेटा रेकॉर्डमध्ये
माझ्याजवळ एक नमुना
आहे; आणि दशलक्ष डेटा
रेकॉर्ड्ससाठी, म्हणून
माझ्याजवळ दशलक्ष
नमुना अर्थ आहे. मी
नमुना म्हणजे सरासरी
असल्यास, दशलक्ष
नमुना म्हणजे माझ्याजवळ
आहे, मला सत्य, अतिशय
जवळ असणे आवश्यक
आहे. जर फक्त दशलक्ष
संभाव्यता असतील,
तर मला सत्य मिळणे
आवश्यक आहे, परंतु
जर हा फरक अजूनही
दहा लाख सरासरी सरासरी
किंवा नमुना अर्थ
आणि सत्य यांच्या
दरम्यान अस्तित्वात
आहे, तर तिथे एक पद्धतशीर
त्रुटी आहे. मी वर

Bengali: 
এবং বর্ণনামূলক বিশ্লেষণে,
আবার, এটি আরো বা কম
অনুসন্ধানকারী মত;
তাৎপর্যপূর্ণ আপনি
তথ্য থেকে কিছু নির্দিষ্ট
নির্ণয় করার চেষ্টা
করছেন এবং আপনি অনুমান
পরীক্ষার এটি অধীন
হয়, যদিও।
সুতরাং, সুনির্দিষ্ট
বিশ্লেষণের সাথে
জড়িত অনেকগুলি নিয়মানুগ,
সংখ্যাসূচক এবং পরিসংখ্যানগত
বিশ্লেষণ রয়েছে
এবং এটি একটি বৃহত্তর

Gujarati: 
માત્ર બાયોમેડિકલ
નથી, પરંતુ દરેક જગ્યાએ.
અને વર્ગીકરણ એકવાર
અમે સુવિધાઓ કાઢીએ,

Bengali: 
বিশ্লেষণের একটি
অংশ হতে পারে যে আপনি
এমন একটি মডেল তৈরির
মতো কাজ করছেন এবং
আরও অনেক কিছু।
যদিও, বর্ণনামূলক
বিশ্লেষণ মূলত একটি
বৃহত্তর বিশ্লেষণে
ভোজন করা হয় না; এটি
সাধারণত ডাটা বিশ্লেষণের
প্রথম ধাপ।
তারপর, আপনি ভবিষ্যদ্বাণীপূর্ণ
শ্লোক প্রকাশ্য আছে।
ভবিষ্যদ্বাণীপূর্ণ
বিশ্লেষণ হচ্ছে যেখানে

Hindi: 
तो लाखों नमूने का
अर्थ है कि मेरे पास,
मुझे सत्य के बहुत
करीब होना चाहिए।
यदि केवल दस लाख संभावनाएं
हैं, तो मुझे सच्चाई
मिलनी चाहिए, लेकिन
यदि कोई अंतर है जो
अभी भी इस लाख नमूना
औसत या नमूना साधनों
और सत्य के औसत के
बीच मौजूद है, तो एक
व्यवस्थित त्रुटि
है।
जैसा कि मैंने ऊपर
लिखा है, इस पहनावा
औसत के बारे में हमने
बात की है, जिसे उम्मीद
के रूप में भी जाना
जाता है।
तो दूसरे शब्दों
में, यदि पूर्वाग्रह
पर वापस आना, तो अनुमान
के अनुमानित मूल्य
सत्य से अलग हैं, तो
हम कहते हैं कि अनुमान
में पूर्वाग्रह है।
अब, भिन्नता में आना,
यह विभिन्न डेटा
रिकॉर्ड में अनुमानों
के फैलाव का एक उपाय
है।
यह बहुत महत्वपूर्ण
है क्योंकि अभ्यास
में मैं केवल एक डेटा
रिकॉर्ड के साथ काम
करता हूं और मैं अपने
सभी संदर्भों को
एक ही डेटा रिकॉर्ड
से बना देता हूं।
मुझे पता होना चाहिए,
मुझे इस सवाल का जवाब
जानने की जरूरत है
- क्या मैंने एक और

Tamil: 
உங்கள் மதிப்பீட்டில்
உள்ள பிழை குறைந்து,
முடிவில்லாமல் செல்கிறது.
எனவே, இவை சில நிபந்தனைகளாகும்,
மேலும் பல ஆராய்ச்சியாளர்கள்
இது பற்றித் தெரியாமல்
இருக்கலாம்.
எனவே, இந்த விரிவுரையின்
கடைசி பகுதியாக இருக்கும்
டேட்டா அனாலிசிஸ்
(Data Analysis) நடைமுறைக்குச்
செல்லுவதற்கு முன்னர்,
டேட்டா அனாலிசிஸ்
(Data Analysis) இலக்கியத்தில்
பொதுவாக காணப்படும்
சில சொற்களோடு பழக்கப்படுத்திக்கொள்ள
இது முக்கியம்.
இங்கே, நாம் முக்கியமாக
எங்களால் முடிவெடுக்கப்
போவதில்லை, அது ஒரு
நிர்ணயிக்கப்படாத
செயல்முறையிலிருந்து
வரும் டேட்டா (Data)வை
சமாளிக்கப் போகிறது,
ஏனென்றால் அது எல்லா
இடங்களிலும் பரவலாக
உள்ளது.
நீங்கள் உறுதியான
மற்றும் சீரற்ற செயல்பாட்டின்
கலவையாக இருந்தாலும்,
இந்த சொற்கள் பொருந்தும்.
எனவே, நாம் அறிந்திருக்க
வேண்டிய முதல் சொல்
காலமானது - மக்கள்
தொகை மற்றும் மாதிரி.
நாம் முன்னர் குறிப்பிட்டது
போல், சீரற்ற செயல்பாட்டில்,
ஒரு தரவுப் பதிவைப்
பெறும்போது, ​​நாம்
வைத்திருக்கும்
தரவுகளின் பதிவுபல
சாத்தியக்கூறுகளில்
ஒன்றாகும் - சில நேரங்களில்
எண்ணற்ற வரையறுக்கப்பட்ட,
சில நேரங்களில் எண்ணற்ற
முடிவிலா பல சாத்தியமான
டேட்டா (Data) பதிவுகள்
உள்ளன, அதில் ஒன்று
நாம் கவனிக்க வேண்டும்;
அந்த கோட்பாடு, முழு
கோட்பாடு அந்த வளாகத்தில்
கட்டப்பட்டுள்ளது.
நீங்கள் கண்டிருக்கக்கூடிய
அனைத்து சாத்தியக்கூறுகளையும்
மக்கள் குறிப்பிடுகின்றனர்,
ஆனால் நாங்கள் அதைக்
கவனிக்கவில்லை; பெரும்பாலான
சூழ்நிலைகளில் உண்மையில்
அனைத்து சாத்தியங்களையும்
கண்காணிக்க முடியாது.

Kannada: 
ಸಂಭವನೀಯವೆಂದು ನಾನು
ಭಾವಿಸಿದಾಗ, ಪ್ರಕ್ರಿಯೆಯ
ಸಾಕಷ್ಟು ತಿಳುವಳಿಕೆಯನ್ನು
ನಾನು ಹೊಂದಿಲ್ಲ ಎಂದು
ಹೇಳುವ ಔಪಚಾರಿಕ ಮಾರ್ಗವಾಗಿದೆ.
ಆದರೆ ನಾನು ಮಿಶ್ರಿತ
ಕೇಸ್ ಹೊಂದಿರುವ ಸಂದರ್ಭಗಳಿವೆ
- ಪ್ರಕ್ರಿಯೆಯ ಒಂದು
ಭಾಗವನ್ನು ನಾನು ಉತ್ತಮ
ಜ್ಞಾನವನ್ನು ಹೊಂದಿದ್ದೇನೆ
ಮತ್ತು ಪ್ರಕ್ರಿಯೆಯ
ಇತರ ಭಾಗವು ನನಗೆ ಮೀರಿದೆ.
ನಾವು ನಿರ್ಣಾಯಕ ಮತ್ತು
ಸಂಭವನೀಯ ಪ್ರಕ್ರಿಯೆಯ
ಮಿಶ್ರಣವನ್ನು ಹೊಂದಿರುವ
ಸ್ಥಳವಾಗಿದೆ.
ಎಂಜಿನಿಯರಿಂಗ್ ಕಣದಲ್ಲಿ
ಇದು ತುಂಬಾ ಸಾಮಾನ್ಯವಾಗಿದೆ,
ಏಕೆಂದರೆ ನಾವು ಮೊದಲೇ
ಚರ್ಚಿಸಿದ್ದ ರಿಯಾಕ್ಟರ್
ಉದಾಹರಣೆಯಲ್ಲಿನಂತೆ,
ದೈಹಿಕ ಪ್ರಕ್ರಿಯೆಯನ್ನು
ಚೆನ್ನಾಗಿ ಅರ್ಥೈಸಬಹುದು,
ಆದರೆ ಸಂವೇದಕ ಅಥವಾ
ಕೆಲವು ಅಡೆತಡೆಗಳ ಪರಿಣಾಮಗಳು,
ನನ್ನ ನಿಯಂತ್ರಣ ಮೀರಿ
ಏನಾದರೂ, ಅವುಗಳನ್ನು
ಸಂಭವನೀಯವಾಗಿ ಪರಿಗಣಿಸಬೇಕು

Malayalam: 
ഡാറ്റ റോക്കോര്‍ഡില്‍
നിന്ന് ഉണ്ടാക്കുന്നു.
ചോദ്യത്തിനുള്ള
ഉത്തരം എനിക്ക് അറിയണം.
- ഞാന്‍ മറ്റൊരു ഡാറ്റ
റെക്കോര്‍ഡ് ശേഖരിച്ചു.
ഞാന്‍ ഡാറ്റ റെക്കോര്‍ഡില്‍നിന്നും
അനുമാനങ്ങള്‍ ഉണ്ടാക്കി,
ആ അനുമാനം ഞാന്‍
ഇപ്പോള്‍ കണ്ടതില്‍
നിന്നും വളരെ വ്യത്യസ്തമായിരിക്കുമോ.
അവ വ്യത്യസ്തവും
വ്യക്തവും സംഖ്യയുമാണെങ്കിലും
വ്യത്യാസങ്ങള് വളരെ
വലുതായിരിക്കുമോ?
അത് വളരെ വലുതാണെങ്കില്‍,
ഞങ്ങള്‍ കണക്കെടുപ്പില്‍
വലിയ വേരിയബിലിറ്റിയുണ്ടെന്ന്
പറയുന്നു.
ഇക്കാരണത്താല്‍,
വേരിയബിളിറ്റി precision
എന്നുമറിയപ്പെടുന്നു.
വേരിയബിലിറ്റി കുറയുമ്പോള്‍
എസ്റ്റിമേറ്ററില്‍
precision കൂടുന്നു.
അതുപോലെ ബയസ് accuracy
യെ സൂചിപ്പിക്കുന്നു.
ബയസ് കുറയുമ്പോള്‍
inaccuracy യും കുറയുന്നു.
വാസ്തവത്തില്‍, ബയസ്
പൂജ്യമെന്ന് അര്‍ത്ഥമാക്കുന്നത്,
അത് കൃത്യതയുള്ളതാണെന്നാണ്.
എസ്റ്റിമേറ്റര്‍
ഒരു കൃത്യമായ സത്യത്തിന്‍റെ
കൃത്യമായ അനുമാനത്തെ
നിങ്ങള്‍ക്ക് നല്‍കുന്നു.
സാധാരണഗതിയില്‍,
വേരിയബിളിനെക്കുറിച്ച്
നാം കൂടുതല്‍ ആശങ്കാകുലരാണ്.
അതെ, തീര്‍ച്ചയായും
ഞങ്ങള്‍ക്ക് ഒരു
കൃത്യമായി വിലയിരുത്തണം.
മാതൃകാപരമായി നമുക്ക്
സൂക്ഷ്മതയും കൃത്യതയുള്ളതുമായ

Marathi: 
लिहिले आहे त्याप्रमाणे
याबद्दल आम्ही जे
बोलले ते देखील याला
अपेक्षा म्हणून ओळखले
जाते. तर दुसऱ्या
शब्दांत, पूर्वाग्रह
वर परत येत असल्यास,
अनुमानाचा अपेक्षित
मूल्य सत्यापेक्षा
भिन्न असेल तर आपण
म्हणू शकतो की अनुमानानुसार
एक पूर्वाभिमुखता
आहे. आता, परिवर्तनशीलता
येण्यासाठी, विविध
डेटा रेकॉर्डवरील
अनुमानांच्या विस्ताराचा
तो एक उपाय आहे. हे
अतिशय महत्वाचे आहे,
अतिशय महत्वाचे आहे
कारण सरावाने मी
एका डेटा रेकॉर्डसह
काम करतो आणि मी माझ्या
एका डेटा रेकॉर्डवरून
सर्व निष्कर्ष बनवितो.
मला माहित असणे आवश्यक
आहे, मला प्रश्नाचं
उत्तर जाणून घेण्याची
गरज आहे - मी आणखी
एक डेटा रेकॉर्ड
गोळा केला होता आणि
मी डेटा रेकॉर्ड
मधील निष्कर्ष काढला
होता, जर हे आकडे मी
आता जे पाहिले असतील
त्यापेक्षा बरेच
वेगळे असतील.
ते वेगळ्या असतील,
स्पष्टपणे, संख्यात्मक,
परंतु फरक खूप मोठा
असेल?

English: 
shortcoming of your estimator.
How do you know if there is bias in your estimation
exercise or in your estimate? Imagine this
thought process; I have collected let’s
say hundred data records or thousand data
records or thousand data records for one process,
and I compute the sample mean for each of
the data records. If I average, let us say,
not even thousand, about a million data records,
per data record I have one sample mean; and
for million data records, therefore I have
million sample means. If I average the sample
means, the million sample means that I have,
I should be very, very, very close to the
truth. If there are only million possibilities,
I should get the truth, but if there is a
difference that still exists between the average
of this million sample averages or sample
means and the truth, then there is a systematic
error. This ensemble average that we talked

Hindi: 
डेटा रिकॉर्ड एकत्र
किया था, और क्या मैंने
डेटा रिकॉर्ड से
सम्मिलन खींचा था,
क्या वे अनुमान अब
जो मैंने देखा है
उससे काफी भिन्न
होंगे।
जाहिर है, वे संख्यात्मक
रूप से अलग होंगे,
लेकिन क्या अंतर
बहुत बड़ा होगा?
और यदि वह बहुत बड़ा
है, तो हम कहते हैं
कि आकलन या अनुमान
में बड़ी भिन्नता
है।
इस कारण से, परिवर्तनशीलता
को परिशुद्धता भी
कहा जाता है।
अनुमान में भिन्नता
कम, अनुमानक अधिक
सटीक है।
इसके विपरीत, पूर्वाग्रह
सटीकता मापता है।
पूर्वाग्रह कम करें,
कम गलतता।
वास्तव में, शून्य
पूर्वाग्रह का मतलब
होगा, यह एक सटीक है;
अनुमानक एक सटीक
है जो आपको सत्य का
सटीक अनुमान देता
है।
आमतौर पर, हम परिवर्तनशीलता
के बारे में अधिक
चिंतित हैं।
हां, ज़ाहिर है कि
हम एक सटीक अनुमान
चाहते हैं; आदर्श
रूप में, हम एक सटीक
और सटीक अनुमान चाहते
हैं।
परिमित नमूनों से
सटीक और सटीक अनुमान
दोनों प्राप्त करना
संभव नहीं है, लेकिन
यदि संभव हो तो हम
निश्चित रूप से कम
पूर्वाग्रह या शून्य
पूर्वाग्रह चाहते

Tamil: 
எனவே, மக்கள் அனைத்து
நிகழ்வுகள் அல்லது
சாத்தியக்கூறுகள்
சேகரிக்க குறிக்கிறது.
வெப்பநிலை அளவைப்
பொறுத்தவரையில்,
நாங்கள் முன்னதாகவே
சுற்றுப்புறத்தைப்
பற்றி பேசினோம்.
நான் ஒரு காலகட்டத்தில்
ஒரு சென்சார் (sensor)
மூலம் நூறு அவதானிப்புகள்
சேகரிக்க என்றால்,
மற்றொரு சென்சார்
(sensor) வேறு விதமாக பார்க்க
வேண்டும்; மற்றொரு
டேட்டா (Data) பதிவகம்
சாத்தியமற்றதாக
இருக்கலாம் அல்லது
அதே சென்சார் டேட்டா
(sensor Data) செய்யக்கூடியதாக
இருக்கலாம், எல்லாவற்றிலும்
நிலையானது வேறுபட்ட
மதிப்பீடுகளை பதிவு
செய்திருக்கலாம்.
எனவே, சாத்தியமான
அனைத்து மதிப்புகளையும்
உணர்ந்து கொள்ள இயலாது,
ஆனால் கோட்பாட்டளவில்
இது சாத்தியமான எல்லா
இடத்தையும் கற்பனை
செய்வது முக்கியமானது,
நாம் அதை ஒரு மாதிரியைப்
பெறுகின்ற மக்களாக
அழைக்கிறோம்.
நான் இங்கே மாதிரி
சொன்னால் அது ஒரு
கவனிப்பு அல்ல, புள்ளியியல்
ஒரு மாதிரி பொதுவாக
அவதானிப்புகள் சேகரிப்பு
குறிக்கிறது.
இது அடிப்படையில்
ஒரு டேட்டா (Data) பதிவு
குறிக்கிறது, ஆனால்
சிக்னல் (signal) செயலாக்கத்தில்,
ஒரு மாதிரி ஒரு உடனடி
ஒரு மதிப்பு இருக்க
முடியும் மற்றும்
அது நிர்ணய உலகில்
உள்ளது.
இந்த மக்கள்தொகை
மற்றும் மாதிரியைப்
பொறுத்தவரையில்
எங்களுக்கு ஒரு உண்மை
மற்றும் மதிப்பீடு
உள்ளது.
நாம் மக்களை அனைத்து
சாத்தியக்கூறுகளின்
தொகுப்பு என்று கூறிக்கொண்டுள்ளோம்,
ஆனால் அது உண்மைதான்.
எனவே, இந்த மொத்த
மக்கள்தொகை, எடுத்துக்காட்டாக,
சில அர்த்தம்.

Malayalam: 
കണക്ക് വേണം. പരിമിതമായ
സാമ്പിളുകളില്‍
നിന്നും കൃത്യമായതും
സൂക്ഷ്മതയുള്ളതുമായ
കണക്ക് ലഭ്യമല്ല.
പക്ഷേ സാധ്യമെങ്കില്‍
കുറഞ്ഞ ബയസ് അല്ലെങ്കില്‍
പൂജ്യം ബയസാകാന്‍
നമ്മള്‍ ആഗ്രഹിക്കും.
കഴിയുന്നത്ര ചെറുതോ
അല്ലെങ്കില്‍ കുറഞ്ഞതോ
ആയ പിശക് സാധ്യമാക്കാന്‍
ശ്രമിക്കും.
അതുകൊണ്ടാണ് ലബോറട്ടറികളില്‍
വിതരണം ചെയ്യുന്ന
പല ഉപകരണങ്ങളിലും
നിങ്ങള്‍ക്ക് കാണാന്‍
കഴിയുന്നത്, ഈ ഉപകരണങ്ങളെ
ഉയര്‍ന്ന സൂക്ഷ്മതയുള്ള
ഉപകരണങ്ങളെപ്പോലെ
യോഗ്യരാക്കുകയാണ്.
ഡാറ്റയില്‍ ഒരു ഗണിതസൂത്രവാക്യം
ഉപയോഗിക്കുന്നത്
പോലെയല്ല, എസ്റ്റിമേഷന്‍
എന്ന് ഓര്‍മ്മിക്കുക.
ഒരു സെന്‍സര്‍ ഒരു
അത് സത്യമായ കണക്കാണ്
അതിന്‍റെ റീഡിംഗില്‍
കാണിക്കുന്നത്.
അതുകൊണ്ട്, വളരെ
വിശാലമായ ഒരു കാഴ്ച
വേണം. അതിനാല്‍, സൂക്ഷ്മതയുള്ള
പ്രൊസഷന്‍ ഉപകരണം
കമ്പനിയ്ക്കോ നിര്‍മ്മാതാവിനോ
ഉണ്ടായിരിക്കണം.
സെന്‍സറിനൊപ്പം
ഒരേ വേരിയബിളിനെ
ആവര്‍ത്തിച്ച് അളക്കുകയാണെങ്കില്‍,
നിങ്ങള്‍ക്ക് വളരെയധികം
വേരിയബിലിറ്റി ഉണ്ടാകില്ല.
തീര്‍ച്ചയായും ചില
വേരിയബിലിറ്റി ഉണ്ടാകും.

English: 
about, as I have written above, is also known
as expectation. So in other words, if coming
back to bias, if the expected value of the
estimate is different from the truth, then
we say that there is a bias in the estimate.
Now, coming to variability, it’s a measure
of the spread of estimates across different
data records. It’s very, very important
because in practice I only work with one data
record and I make all my inferences from a
single data record. I need to know, I need
to know the answer to the question - had I
collected another data record, and had I drawn
the inferences from the data record, would
those inferences be significantly different
from what I have seen now. They will be different,
obviously, numerically, but will the difference
be too large? And if that is too large, then

Marathi: 
आणि जर ती खूप मोठी
असेल तर आपण असे म्हणू
शकतो की अंदाजपत्रकात
किंवा अंतिमत अंदाजानुसार
मोठी परिवर्तनशीलता
आहे. या कारणास्तव,
परिवर्तनशीलतेला
सुस्पष्टता म्हणूनही
ओळखले जाते. अंदाजे
कमीपणाचा अंदाज कमीतकमी
आहे, अंदाजक याउलट,
पूर्वाभिमुखतेची
अचूकता.
पूर्वाग्रह कमी करा,
चुकीची चूक. खरेतर,
शून्य पूर्वाग्रह
म्हणजे अचूक आहे;
अंदाजपत्रक हा अचूक
आहे ज्यामुळे आपल्याला
सत्याचा अचूक अंदाज
येतो सामान्यत :, परिवर्तनशीलतेबद्दल
आम्हाला अधिक चिंता
आहे होय, अर्थातच
आम्ही एक अचूक अंदाज
इच्छित; आदर्शवत,
आम्हाला अचूक आणि
अचूक अंदाज पाहिजे
आहे. मर्यादित सॅम्पलमधून
एक अचूक आणि अचूक
अंदाज दोन्ही मिळविणे
शक्य नाही, परंतु
शक्य असल्यास कमी
पूर्वाभिमुख किंवा
शून्य पूर्वाग्रह
असणे शक्य आहे आणि
शक्य तितक्या लहान
किंवा कमी त्रुटीसारखे
आहे. म्हणूनच आपण
प्रयोगशाळेत पुरविलेल्या
अनेक साधनांवर पहात
आहात, तर आपल्याकडे
हे उपकरण उच्च सुस्पष्ट
साधने म्हणून पात्र
आहेत. लक्षात ठेवा,
अंदाज हा केवळ डेटावरील

Kannada: 
ಸರಳವಾಗಿ ನಾನು ಅವರನ್ನು
ನಿಖರವಾಗಿ ಊಹಿಸಲು
ಸಾಧ್ಯವಿಲ್ಲ.
ಆದ್ದರಿಂದ, ಅಲ್ಲಿ
ನಾವು ನಿರ್ಣಾಯಕ ಮತ್ತು
ಸಂಭವನೀಯ ಕಾಮೆಂಟ್ಗಳನ್ನು
ಎದುರಿಸಬೇಕಾಗಬಹುದು,
ಮತ್ತು ಅದನ್ನು ಮಾಡಲು
ಅನುಮತಿಸುವ ಒಂದು ಸಿದ್ಧಾಂತವಿದೆ.
ಆದ್ದರಿಂದ, ಬಾಟಮ್
ಲೈನ್ ದಯವಿಟ್ಟು ಕೇಳುವ
ಕೆಲವು ಕ್ಷಣಗಳನ್ನು
ಖರ್ಚು ಮಾಡಿದೆ - ನಿರ್ಣಾಯಕವಾದ
ಅಥವಾ ಸಂಭವನೀಯ ಪ್ರಕ್ರಿಯೆ
ಅಥವಾ ಮಿಶ್ರಿತ ಪ್ರಕ್ರಿಯೆಯಿಂದ
ಹೊರಬರುವ ನೀವು ಡೇಟಾವನ್ನು
ನಿರ್ಣಾಯಕ ಎಂದು ಪರಿಗಣಿಸಲು
ಬಯಸುವಿರಾ, ಮತ್ತು
ಏಕೆ ನೀವು ಉತ್ತರವನ್ನು
ಹೊಂದಿರಬೇಕು ನೀವು
ಆ ಕಲ್ಪನೆಯನ್ನು ಮಾಡಿದ್ದೀರಿ,
ಏಕೆಂದರೆ ವಿಶ್ಲೇಷಣೆಯ
ಕೋರ್ಸ್ ನಿಜವಾಗಿಯೂ
ಅದರ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿದೆ.
ಸರಿ, ಕೇವಲ ಒತ್ತಿಹೇಳಲು,
ಡೇಟಾವನ್ನು ನಿರ್ಣಾಯಕ

Gujarati: 
અમે છબીનું વર્ગીકરણ
કરવા માંગીએ છીએ.
છબી એનાલિસિસ(analysis)માં,
આ એક ખૂબ જ સામાન્ય
અભ્યાસ છે. અમે સમાન
રંગો, વાળના રંગ, સમાન

Bengali: 
তথ্য ডেটা উপর ভিত্তি
করে শিরোনাম করা
হয়।
এবং এই অনেক অনেক
দরকারী, অনেক অ্যাপ্লিকেশন;
যদিও নির্দেশনামূলক
কেন জিজ্ঞাসা করা
হয় কেন কিছু ঘটেছে।
তাই, আপনি ডক্টরেট
বা একজন প্রকৌশলী
হিসেবে অথবা একজন
অর্থনীতিবিদ হিসাবেও
তথ্য দেখেছেন এবং
আপনি বাজারের তথ্য

Gujarati: 
આંખનો રંગ, અને ચહેરાના
ચામડી રંગવાળા લોકોનું
વર્ગીકરણ કરવાનો
પ્રયાસ કરીએ છીએ.

Tamil: 
ஒரு குழுவினரின்
சராசரி ஊதியத்தை
நான் பார்த்துக்
கொள்கிறேன் - ஒரு
மிகப்பெரிய நாட்டில்,
எங்களுக்கு சொல்ல
அல்லது மிகப்பெரிய
நிறுவனத்தில் இருக்கிறேன்.
நான் போய் ஒவ்வொருவரிடமும்
கேட்கிறேன்.
நடைமுறை காரணங்களுக்காக,
நான் ஒரு சில நபர்களை
அவர்களது சம்பளத்தைப்
பற்றிய தகவலை சேகரிக்க
மற்றும் உண்மையான
சராசரி சம்பளத்தை
நான் எடுத்துக் கொள்ளுமாறு
கேட்கிறேன்.
எனவே, சராசரி சம்பளம்
ஒரு உண்மை, அதாவது
மக்கள் தொகையின்
தன்மை என்ன - அந்த
வயதுக் குழு - மற்றும்
மதிப்பீடு நான் தரவுகளிலிருந்து
பெறும்.
வெளிப்படையாக, மதிப்பீடு
எப்போதுமே சத்தியத்திலிருந்து
வேறுபட்டது, ஏனென்றால்
எல்லா சாத்தியக்கூறுகளையும்
நான் பார்த்ததில்லை.
மதிப்பீட்டுக் கோட்பாடு,
தரவுகளின் பதிவுகளிலிருந்து
திறமையான அளவுகோலில்,
விருப்ப அளவுருவை
எப்படி மதிப்பிடுவது
என்று உங்களுக்கு
சொல்கிறது.
இது சம்பந்தமாக,
இந்த மதிப்பீடு எங்களுக்கு
உள்ளது.
புள்ளியியல் மற்றும்
மதிப்பீட்டாளர்
என்று நீங்கள் இந்த
விதிமுறைகளை வைத்திருக்கிறீர்கள்.
ஒரு புள்ளிவிவரம்
என்பது உங்கள் அனுமான
கணித செயல்பாடு அல்ல.
மீண்டும், மாதிரி
என்பது ஒரு புள்ளிவிவரம்
ஆகும்; மாதிரி மாறுபாடு
ஒரு புள்ளிவிவரம்.
இது ஒரு கணித செயல்பாடு.
மதிப்பீட்டாளர்
ஒரு கணித செயல்பாடு
ஆகும்.
இது ஒரு மென்மையான
சாதனமாகவோ அல்லது
மெய்நிகர் சாதனமாகவோ,
ஒரு கணித வழியில்
தரவுகளை செயல்படுத்துவதாகவும்,
நீங்கள் விரும்பியதை
மதிப்பீடு செய்யுமென்று
கூறலாம்.
புள்ளிவிபரத்திற்கும்
மதிப்பீட்டிற்கும்
உள்ள வித்தியாசம்
மிகவும் சுருக்கமாக

Marathi: 
गणिती सूत्राचा वापर
करीत नाही. खरंच एक
सेन्सरही, जो तुम्हाला
देतो तो वाचन सत्याचा
एक अंदाज आहे. तर,
एक अतिशय व्यापक
दृष्टिकोन असावा.
तर, कंपनी किंवा उत्पादक
म्हणजे काय हाय जुलूस
इन्स्ट्रुमेंट म्हणजे
जर तुम्ही वारंवार
सेन्सरने समान व्हेरिएबल
मोजत असाल, तर तुम्हाला
अधिक परिवर्तनशीलता
दिसणार नाही. नक्कीच
काही बदलता येतील.
तर थर्मामीटर घ्या
आणि आपल्या शरीरावर
ठेवा, आणि वाचन घ्या.
वाचन खाली लक्षात
ठेवा. नंतर पुन्हा,
थर्मामीटर घ्या,
नंतर शरीराच्या त्याच
भागावर ठेवा आणि
वाचन घ्या. नक्कीच,
आपण कदाचित तेथे
त्याच वाचन पहाल,
कारण थर्मामीटर पूर्वीच्या
दशकानंतरच्या समस्येची
तक्रार करत नाहीत,
परंतु थर्मामीटर
रिपोर्टिंग असल्यास
चौथ्या किंवा पाचव्या
दशांश असू शकते आणि
अशीच एक वास्तविक
बदलण्याची शक्यता
आपण पाहू शकता. त्याला
इन्स्ट्रुमेंटचा
ठराव म्हणतात.
पण, असं असलं तरी,
त्याच वेगाच्या मोजमापांची
पुनरावृत्ती होताना
आपण निश्चितपणे वेगवेगळ्या

Kannada: 
ಎಂದು ಏಕೆ ಪರಿಗಣಿಸಲಾಗಿದೆ
ಎಂಬುದರ ಬಗ್ಗೆ ಸ್ಪಷ್ಟವಾಗಿರಬೇಕು,
ವಿಶೇಷವಾಗಿ ಇದು ತುಂಬಾ
ಸಾಮಾನ್ಯ ಊಹೆಯಾಗಿದೆ;
ವಾಸ್ತವವಾಗಿ, ಅನೇಕ
ಸಂಶೋಧಕರು ದತ್ತಾಂಶವನ್ನು
ವಿಶ್ಲೇಷಣೆ ಮಾಡುತ್ತಾರೆ
ಮತ್ತು ಏಕೆ ಮತ್ತು
ಯಾವ ರೀತಿಯ ಸಂಭವನೀಯತೆಯನ್ನು
ಕೇಳಬೇಕೆಂದು ಸ್ವಲ್ಪ
ಸಮಯದವರೆಗೆ ವಿರಾಮಗೊಳಿಸದೆಯೇ
ಡೇಟಾವನ್ನು ಸಂಭವನೀಯಗೊಳಿಸಬಹುದು.
ಸಂಭವನೀಯ ಪ್ರಕ್ರಿಯೆಯಿಂದ
ಹೊರಬರಲು ಡೇಟಾವನ್ನು
ನಾನು ಭಾವಿಸಿದ್ದೇನೆಂದರೆ,
ನಾನು ಕೇವಲ ಮುಂದೆ
ಹೋಗಿ ನನ್ನ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
ನಡೆಸಲು ಸಾಧ್ಯವಿಲ್ಲ.
ಸಂಭವನೀಯ ಪ್ರಕ್ರಿಯೆಗಳಲ್ಲಿ,
ಹಲವಾರು ವರ್ಗೀಕರಣಗಳಿವೆ
ಮತ್ತು ನನ್ನ ಊಹೆಯಲ್ಲಿ
ನಾನು ಸ್ಪಷ್ಟವಾಗಿರಬೇಕು.
ಇದು ಎಲ್ಲಾ ಊಹೆಯ ನಂತರ,
ಆದರೆ ಇದು ಸ್ಟೇಷನರಿ
ಸಂಚಲನ ಪ್ರಕ್ರಿಯೆಯಿಂದ
ಹೊರಬರುತ್ತಿಲ್ಲವೇ,
ಸ್ಟೇಷನರಿ-ಅಲ್ಲದ ಸಂಭವನೀಯ
ಪ್ರಕ್ರಿಯೆ ಅಥವಾ ಆವರ್ತಕ

Malayalam: 
ഒരു തെര്‍മോമീറ്റര്‍
എടുത്തു നിങ്ങളുടെ
ശരീരത്തില്‍ വച്ച്
റീഡിംഗ് എടുക്കുക.
വീണ്ടും തെര്‍മോമീറ്റര്‍
എടുത്തു.
അതേ ശരീരത്തില്‍
അതേ ഭാഗത്ത് വെച്ച്
റീഡിംഗ് നോക്കുക.
തെര്‍മോമീറ്ററുകള്‍
ആദ്യത്തെ ദശാംശത്തിനപ്പുറത്ത്
റിപ്പോര്‍ട്ട് ചെയ്യാത്തതിനാല്‍,
നിങ്ങള്‍ അതേ റീഡിംഗ്
കാണും.
എന്നാല്‍ തെര്‍മോമീറ്ററുകളുടെ
റിപ്പോര്‍ട്ടിങ്
നാല് അല്ലെങ്കില്‍
അഞ്ച് ഡെസിമെല്‍
വരെയാണെങ്കില്‍
നിങ്ങള്‍ക്ക് യഥാര്‍ത്ഥ
വേരിയബിലിറ്റി കാണാം.
അത് ഉപകരണത്തിന്‍റെ
റെസല്യൂഷന്‍എന്നറിയപ്പെടുന്നു.
എന്നാല്‍, ഒരേ വേരിയബിളിന്‍റെ
അളവ് ആവര്‍ത്തിക്കപ്പെടുമ്പോള്‍
തീര്‍ച്ചയായും നിങ്ങള്‍ക്ക്
വ്യത്യസ്ത റീഡിംഗ്
നല്‍കും.
എന്നാല്‍ ആ റീഡിംഗുകളില്‍
വലിയ വ്യത്യാസങ്ങള്‍
നിങ്ങള്‍ ആഗ്രഹിക്കുന്നില്ല.
അതിനാല്‍, നിങ്ങള്‍ക്ക്
ഒരു ഉയര്‍ന്ന കൃത്യതയുള്ള
ഉപകരണം ആവശ്യമുണ്ട്.
അങ്ങനെ നമ്മള്‍ close
termininology അല്ലെങ്കില്‍
major terminilogyലേയ്ക്ക്
കടന്നുവരുന്നു.
തീര്‍ച്ചയായും, ഒരു
പരിചയപ്പെടാന്‍
ആഗ്രഹിക്കുന്ന മറ്റ്
പല പദങ്ങളുമുണ്ട്,
പക്ഷേ അടിസ്ഥാനപരമായ
അറിവാണ്.

English: 
we say there is a large variability in the
estimation or in the estimate. For this reason,
variability is also referred to as precision.
The lower the variability in the estimate,
the more precise is the estimator. In contrast,
bias measures accuracy. Lower the bias, lesser
the inaccuracy. In fact, zero bias would mean,
it’s an accurate; the estimator is an accurate
one gives you an accurate estimate of the
truth. Typically, we are more worried about
variability. Yes, of course we want an accurate
estimate; ideally, we want an accurate and
a precise estimate. It’s not possible to
obtain both an accurate and precise estimate
from finite samples, but what definitely we
would like to have is low bias or zero bias
if possible, and as small or low error as
possible. That is why you see on many instruments

Bengali: 
দেখেছেন এবং হঠাৎ
একটি ক্র্যাশ হয়েছে
এবং আপনি ভালভাবে
জিজ্ঞেস করছেন - কেন
এই দুর্ঘটনা ঘটেছে
বা কেন ঘটেছে?
একটি নির্দিষ্ট ফল্ট
একটি প্রক্রিয়া
এবং তাই এ ঘটতে।
এবং তারপর, আপনি, অবশ্যই,
এই কিভাবে প্রতিরোধ
করতে হিসাবে সুপারিশ
যাচ্ছে।
সুতরাং, নির্দেশনামূলক
বিশ্লেষণের সাথে

Hindi: 
हैं, और जितना संभव
हो उतना छोटा या कम
त्रुटि।
यही कारण है कि आप
प्रयोगशालाओं को
आपूर्ति किए जा रहे
कई उपकरणों पर देखते
हैं, आप इन उपकरणों
को उच्च परिशुद्धता
उपकरणों के रूप में
योग्यता प्राप्त
कर रहे हैं।
याद रखें, अनुमान
केवल डेटा पर गणितीय
सूत्र का उपयोग करने
के बारे में नहीं
है।
यहां तक ​​कि एक सेंसर
वास्तव में, जो पाठ
आपको देता है वह सत्य
का अनुमान है।
तो, एक बहुत व्यापक
दृष्टिकोण होना चाहिए।
तो, उच्च जुलूस उपकरण
द्वारा कंपनी या
निर्माता का क्या
अर्थ है, यदि आप सेंसर
के साथ वही चर को बार-बार
मापना चाहते हैं,
तो आपको बहुत अधिक
परिवर्तनशीलता दिखाई
नहीं देगी।
निश्चित रूप से कुछ
बदलावशीलता होगी।
तो, एक थर्मामीटर
लें, और इसे अपने शरीर
पर रखें, और पढ़ना
लें।
पढ़ने के नीचे ध्यान
दें।
फिर फिर, थर्मामीटर
लें, फिर इसे शरीर
के उसी हिस्से पर
रखें और पढ़ना लें।
बेशक, आप शायद वही
पढ़ रहे होंगे, क्योंकि
थर्मामीटर पहले दशमलव
से परे रिपोर्ट नहीं
करते हैं, लेकिन यदि
आपके पास थर्मामीटर

Kannada: 
ಸಂಭವನೀಯ ಪ್ರಕ್ರಿಯೆ
ಮತ್ತು ಇನ್ನಿತರ ವಿಷಯಗಳ
ಕುರಿತು ನಾನು ಸ್ಪಷ್ಟವಾಗಿರಬೇಕು.
ಆದ್ದರಿಂದ, ವಿವಿಧ
ವರ್ಗಗಳಿವೆ ಮತ್ತು
ನಾವು ತುಂಬಾ ಸ್ಪಷ್ಟವಾಗಿರಬೇಕು.
ಇದು .. ಎಲ್ಲವನ್ನೂ ನಾವು
ಚಿಂತಿಸಬೇಕಾದ ನಿಯಮಿತ
ವರ್ಗೀಕರಣಗಳಿಂದ ಹೊರತುಪಡಿಸಿ
- ಅಕ್ಷಾಂಶ ಸ್ಥಿರವಾದ
ಸ್ಥಿತಿ ಅಥವಾ ಕ್ರಿಯಾತ್ಮಕ
ಪ್ರಕ್ರಿಯೆಯಿಂದ ಹೊರಬರುತ್ತದೆಯೆ
ಎಂಬುದು ರೇಖೀಯ ಅಥವಾ
ರೇಖಾತ್ಮಕವಲ್ಲದ.
ಎಲ್ಲರೂ ಇನ್ನೂ ಒಳ್ಳೆಯದನ್ನು
ಹೊಂದಿದ್ದಾರೆ, ಆದರೆ
ಇದು ಬಹಳ ಮುಖ್ಯವಾದ
ವರ್ಗೀಕರಣವಾಗಿದ್ದು,
ನೀವು ಮುಂಚೂಣಿಯಲ್ಲಿರಬೇಕು.
ಮತ್ತು, ಸಾಮಾನ್ಯವಾಗಿ,
ನೀವು ಪ್ರಯೋಗದ ಪ್ರವೇಶವನ್ನು
ಹೊಂದಿದ್ದರೆ, ಇದು
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ
ವ್ಯಾಪ್ತಿಯ ಹೊರಗೆ,
ಆದರೆ ನಿಮ್ಮ ಪ್ರಯೋಗದ
ಸಮಯದಲ್ಲಿ ಸಾಧ್ಯವಾದರೆ
ಯಾದೃಚ್ಛಿಕ ಮೂಲಗಳನ್ನು
ನಿಗ್ರಹಿಸಲು ಸಂಬಂಧಿಸಿದೆ.

Bengali: 
সম্পর্কিত একটি নির্ণয়ের
এবং প্রতিকারমূলক
বিষয় হতে যাচ্ছে।
সুতরাং, স্পষ্টতই,
জড়িত বিভিন্ন বিশ্লেষণ
একটি সম্পূর্ণ হোস্ট
আছে এবং আমি তালিকাভুক্ত
না আছে যে অনেক অন্যান্য
শ্রেণীবিভাগ আছে।
সাধারণত, ভাল শুরু
পয়েন্ট অনুসন্ধানমূলক
এবং বর্ণনামূলক বিশ্লেষণ
হয় এবং তারপর এক
থেকে আয়; এমনকি যদি
আপনি সিদ্ধান্ত নিয়েছেন

English: 
that are being supplied to laboratories, you
have these instruments being qualified as
high precision instruments.
Remember, estimation is not just about we
using a mathematical formula on data. Even
a sensor actually, the reading that it gives
you is an estimate of the truth. So, one should
have a very broad view. So, what the company
or the manufacturer means by high procession
instrument is, if you were to repeatedly measure
the same variable with the sensor, you would
not see too much variability. Definitely there
will be some variability. So, take a thermometer,
and place it on your body, and take the reading.
Note down the reading. Then again, take the
thermometer, then place it on the same part
of the body and take the reading. Of course,
you will probably see the same reading there,
because thermometers don’t report beyond
first decimal, but you may see an actual variability
if you have thermometers reporting may be
the fourth or fifth decimal and so on. That

Malayalam: 
നമുക്ക് ഡേറ്റാ വിശകലനത്തിന്
വേണ്ടി പിന്തുടരേണ്ട
നടപടിക്രമങ്ങളുടെ
ലെക്ചറോടെ നമ്മളിത്
അവസാനിപ്പിക്കുകയും
തുടര്‍ന്ന് ആര്‍
ലെ ചില ഉദാഹരണങ്ങളിലേക്ക്
പോകുകയും ചെയ്യും.
ഏറ്റവും പ്രധാനപ്പെട്ട
കാര്യം, വിശകലനരീതികള്‍ക്ക്
ആവര്‍ത്തനസ്വഭാവമാണുള്ളത്.
ഘട്ടം 1, ഘട്ടം 2, ഘട്ടം
3, ഘട്ടം 4 എന്നിങ്ങനെ
പ്രതീക്ഷിക്കരുത്.
അങ്ങനെ സംഭവിക്കുന്നത്
വളരെ വിരളമാണ്.
അവ ക്രമത്തിലായിരിക്കണമെന്ന്
നിര്‍ബന്ധമില്ല.
പക്ഷേ അതില്‍ ഒരു
പ്രത്യേക ക്രമം ഉണ്ട്.
ചിട്ടയായി ചെയ്തുകൊണ്ട്
നിങ്ങള്‍ പോകണമെന്ന്
അത് അര്‍ത്ഥമാക്കുന്നില്ല.
കൂടാതെ ഏതെങ്കിലും
ഡാറ്റ വിശകലനത്തിന്‍റെ
വിജയം രണ്ട് കാര്യങ്ങളെ
ആശ്രയിച്ചാണിരിക്കുന്നത്.
നിങ്ങള്‍ ശേഖരിക്കുന്ന
ഡാറ്റയുടെ നിലവാരവും
നിങ്ങളുപയോഗിക്കുന്ന
സിസ്റ്റമാറ്റിക്
രീതികളും അല്ലെങ്കില്‍
ഡാറ്റ വിശകലനത്തില്‍
നിങ്ങള്‍ ഉപയോഗിച്ച
ഉപകരണങ്ങള്‍ അല്ലെങ്കില്‍
നിങ്ങള്‍ പിന്തുടര്‍ന്ന
മുഴുവന്‍ രീതിശാസ്ത്രവും
ഡാറ്റ ഗുണമേന്മ മോശമാണെങ്കില്‍,
നിങ്ങള്‍ക്ക് കൂടുതല്‍
ചെയ്യാന്‍ കഴിയില്ല.
നിങ്ങള്‍ വ്യവസ്ഥാപരമായ
നടപടിക്രമങ്ങള്‍
പിന്തുടരുകയാണെങ്കില്‍പ്പോലും,
നിങ്ങള്‍ക്ക് അതിശയകരമായ

Marathi: 
रीडिंग्स देऊ, परंतु
तुम्हाला त्या रीडिंग्समध्ये
बर्याच फरक नको आहेत.
तर, तुम्हाला एक उच्च
सुस्पष्टता साधन
हवे आहे. म्हणून, त्याबरोबर
आपण जवळच्या परिभाषा
किंवा मुख्य परिभाषा
यांत येतो. अर्थात,
अशा अनेक शब्द आहेत
ज्यात एखाद्याला
परिचित व्हावे असे
वाटते परंतु त्या
मूलतत्त्वे आहेत.
आपण डेटा विश्लेषणासाठी
लागणाऱ्या प्रक्रियेसंदर्भात
लेक्चर संपवू, आणि
नंतर, आर मध्ये काही
उदाहरणे समोर आणा.
सर्वात महत्त्वाची
गोष्ट म्हणजे लक्षात
ठेवा की जवळजवळ सर्व
डेटा विश्लेषण प्रक्रिया
निसर्गात पुनरावृत्ती
आहेत. चरण 1, चरण 2, चरण
3, चरण 4, पूर्ण होण्याची
अपेक्षा करू नका.
हे असे कधीच होणार
नाही, फार क्वचितच.
म्हणून, ते अनुक्रमिक
नाहीत, परंतु त्यामध्ये
विशिष्ट क्रम आहे.
याचा अर्थ असा नाही
की तुम्ही आकस्मिकपणे
करत आहात. तसेच, लक्षात
ठेवा की कोणत्याही
डेटा विश्लेषणाचा
यश दोन गोष्टींवर
अवलंबून आहे: आपण
एकत्रित केलेल्या
डेटाची गुणवत्ता

Tamil: 
இருக்கிறது.
ப்ரீமா முகம் (Prima
facie) அவர்கள் ஒரே மாதிரியாக
இருப்பதாகத் தோன்றுகிறது,
ஆனால் வித்தியாசம்
என்னவென்றால், புள்ளிவிவரம்
என்பது எந்தவொரு
நோக்கத்திற்காகவும்
அவசியமற்ற ஒரு கணித
செயல்பாடு அல்ல;
ஒரு மதிப்பீட்டாளர்
ஒரு கணித செயல்பாடாக
இருக்கிறார், அது
ஒரு குறிப்பிட்ட
நோக்கத்திற்காக
மனதில் ஏதோ எண்ணத்தை
மதிப்பிடுவதன் மூலம்
செய்யப்படுகிறது.
எனவே, நீங்கள் மதிப்பீட்டைக்
கோட்பாட்டில் மேலும்
கீழே சென்றால், புள்ளியியல்
மற்றும் மதிப்பீட்டாளருக்கு
இடையிலான இந்த வித்தியாசத்தை
பற்றி மேலும் விவாதிக்கும்,
ஆனால் கணித செயல்பாடு
வரை, தரவுகளின் கணித
செயல்பாடுகளை இரண்டும்
ஆகும்.
எனவே, மதிப்பீட்டுக்
கோட்பாட்டில், நாம்
புள்ளிவிவரங்களையும்
மதிப்பீட்டாளர்களையும்
அடிக்கடி பயன்படுத்துகிறோம்.
எனவே, மாதிரியானது
ஒரு புள்ளிவிவரமும்
உண்மை மதிப்பீடும்
ஆகும், ஏனென்றால்
உண்மையான அர்த்தத்தை
மதிப்பிடுவதற்கு,
மறுபடியும் மறுபரிசீலனை
செய்வதற்கு மாதிரி
பொருள் திட்டமிடப்பட்டுள்ளது;
நீங்கள் அதை மக்கள்
மற்றும் மாதிரி பற்றி
அனைத்து பார்க்க
முடியும்; குழு மற்றும்
மாதிரி சராசரிகள்
உள்ளன.
நீங்கள் எப்போதாவது
பார்த்திருக்கக்கூடிய
அனைத்து மதிப்புகளிலிருந்தும்
கணக்கிடப்படும்
சராசரியாக சராசரியாக
இருக்கிறது, இது
நிச்சயமாக நாம் பார்க்க
வேண்டியதில்லை; எல்லா
சூழ்நிலைகளிலும்
நாம் எதையாவது பெற
முடியவில்லையே, அல்லது
சம்பள உதாரணமாக,
அர்த்தமுள்ள நேரத்தில்
எல்லா மக்களிடமிருந்தும்
தகவல்களைச் சேகரிக்க
முடியாமல் போகலாம்,
மாதிரி சராசரியாக,
நிச்சயமாக சராசரியாக
கணக்கிடப்படுகிறது
இந்த மாதிரிகள் இருந்து.

Hindi: 
रिपोर्टिंग चौथी
या पांचवीं दशमलव
हो सकती है तो आप वास्तविक
परिवर्तनशीलता देख
सकते हैं।
इसे उपकरण का संकल्प
कहा जाता है।
लेकिन, वैसे भी, बिंदु
एक ही चर के माप को
दोहराया जाता है
निश्चित रूप से आपको
अलग-अलग रीडिंग देगा,
लेकिन आप उन रीडिंग
में व्यापक बदलाव
नहीं चाहते हैं।
तो, आप एक उच्च परिशुद्धता
उपकरण चाहते हैं।
तो, इसके साथ हम निकट
शब्दावली या प्रमुख
शब्दावली में आते
हैं।
बेशक, कई अन्य शर्तें
हैं जिनसे कोई परिचित
होना चाहता है, लेकिन
वे मूल बातें हैं।
हम इस प्रक्रिया
के साथ व्याख्यान
निष्कर्ष निकालेंगे
कि किसी को डेटा विश्लेषण
(DATA ANALYSIS)के लिए पालन
करने की आवश्यकता
है, और उसके बाद, आर
में कुछ उदाहरण उदाहरणों
पर जाएं
याद रखने की सबसे
महत्वपूर्ण बात यह
है कि लगभग सभी डेटा
विश्लेषण (DATA ANALYSIS)प्रक्रिया
प्रकृति में पुनरावृत्त
हैं।
चरण 1, चरण 2, चरण 3, चरण
4, की अपेक्षा न करें।
यह कभी भी ऐसा ही नहीं
होगा, बहुत ही कम है।
इसलिए, वे जरूरी अनुक्रमिक
नहीं हैं, लेकिन इसमें
एक निश्चित आदेश
है।

Gujarati: 
અને તે પછી, આ તમામને
કેન્દ્રિત પૂર્વધારણા
પરીક્ષણ છે. પૂર્વધારણા
પરીક્ષણ શું છે?
તે ડેટા એનાલિસિસ(data
analysis)માં ખૂબ, ખૂબ જ

Bengali: 
যে আপনি ভবিষ্যতের
জন্য একটি মডেল তৈরি
করতে যাচ্ছেন এবং
তাই, এটি একটি সুপারিশ
করার সুপারিশ করা
হচ্ছে যে আপনি ডেটা
সন্ধান করবেন, আপনি
ডেটার সাথে বন্ধুত্ব
করবেন, এবং আপনি নিজের
সাথে পরিচিত হবেন,
আপনি মডেল তৈরিতে
এগিয়ে যাওয়ার আগে,
উদাহরণ স্বরূপ.

Kannada: 
ಇದು ಒಂದು ಭಾಗವಾಗಿದೆ,
ಇದು ಪ್ರಯೋಗಗಳ ವಿನ್ಯಾಸದಲ್ಲಿ
ವಿವರವಾಗಿ ವ್ಯವಹರಿಸಲ್ಪಟ್ಟ
ವಿಷಯವಾಗಿದೆ ಮತ್ತು
ನಾವು ಇಲ್ಲಿಗೆ ಹೋಗುವುದಿಲ್ಲ.
ಜನರು ಸಾಮಾನ್ಯವಾಗಿ
ತಪ್ಪಿಸಿಕೊಳ್ಳುವ
ಪ್ರಮುಖ ವಿಷಯವೆಂದರೆ
- ಆರಂಭಿಕರಿಗಾಗಿ - ನಾನು
ಡೇಟಾದಿಂದ ಸೆಳೆಯುವ
ಯಾವುದೇ ಅಂದಾಜು ಅಥವಾ
ಯಾವುದೇ ನಿರ್ಣಯವು
- ಮತ್ತು ಸಾಮಾನ್ಯವಾಗಿ
ಸಾಕಷ್ಟು ಡೇಟಾವನ್ನು
ಯಾದೃಚ್ಛಿಕ ಅಥವಾ ಸಂಭವನೀಯ
ಪ್ರಕ್ರಿಯೆಯಿಂದ ಹೊರಬರಲು
ಭಾವಿಸಲಾಗಿದೆ; ಆ ಅಂದಾಜುಗಳು
ಅಂದಾಜುಗಳು ಕೂಡ ಯಾದೃಚ್ಛಿಕವಾಗಿರುತ್ತವೆ,
ಏಕೆಂದರೆ ನೀವು ಅದರಲ್ಲಿ
ಅನಿಶ್ಚಿತತೆಯನ್ನು
ಹೊಂದಿರುವ ಡೇಟಾದ ಮೂಲಕ
ಹಾಕುತ್ತಿದ್ದಾರೆ.
ಕೆಲವು ಕಾರ್ಯವಿಧಾನದ
ಮೂಲಕ, ಕೆಲವು ಸೂತ್ರ,
ಕೆಲವು ಗಣಿತ ಪ್ರಕ್ರಿಯೆ
ಮತ್ತು ನೀವು ಹೊರಬರುತ್ತಿರುವುದು,
ಉದಾಹರಣೆಗೆ, ನಾನು
ಮಾದರಿಯನ್ನು ಅರ್ಥೈಸುತ್ತೇನೆ.
ನಾನು ಸಂವೇದಕದಿಂದ
ಡೇಟಾ, ಸುತ್ತುವರಿದ

English: 
is called resolution of the instrument. But,
anyway, the point is repeated measurement
of the same variable definitely will give
you different readings, but you don’t want
wide variations in those readings. So, you
want a high precision instrument.
So, with that we come to the close terminology
or the major terminology. Of course, there
are many other terms that one would want to
be familiar with, but those are the basics.
We will conclude the lecture with the procedure
that one needs to follow for data analysis,
and then, move on to a couple of illustrative
examples in R.
The foremost thing to remember is that almost
all data analysis procedures are iterative
in nature. Don’t expect step 1, step 2,
step 3, step 4, done. It’s never going to
be that way, very rarely. So, they are not
necessarily sequential, but there is a certain
order in it. It doesn’t mean that you go
about doing in a haphazard manner. And also,

Malayalam: 
ഫലങ്ങള്‍ ലഭിക്കാതിരിക്കാം;
മാത്രമല്ല ഡാറ്റയുടെ
ഗുണനിലവാരം മികച്ചതാണെങ്കില്‍പ്പോലും
നിങ്ങള്‍ വളരെ അപ്രസക്തമായ
രീതി പിന്തുടരുന്നു.
നിങ്ങള്‍ വളരെ മോശം
എസ്റ്റിമേറ്റര്‍
ഉപയോഗിക്കുന്നു.
ഇപ്പോള്‍ തീര്‍ച്ചയായും
ഡാറ്റയുടെ ഗുണനിലവാരം
പലപ്പോഴും നമ്മുടെ
കൈകളില്‍ അല്ല. പക്ഷേ
നിങ്ങള്‍ ഒരു ഡാറ്റ
നോക്കിയാല്‍ ഈ ഡാറ്റ
ഗുണനിലവാരമില്ലാത്തതിനാല്‍
നല്ല ഫലം നല്‍കില്ലെന്ന
കാര്യം നിങ്ങളറിയണം.
നിങ്ങള്‍ ഒരു കണ്‍സള്‍ട്ടന്‍റ്
ആണെന്ന് കരുതുക.
നിങ്ങള്‍ ഡാറ്റ നല്‍കിയിട്ടുണ്ടെങ്കില്‍,
നിങ്ങള്‍ ഒരു പ്രോസസ്
ഇന്‍ഡസ്ട്രിയില്‍
നിന്ന് ഡാറ്റ വിശകലനത്തിനായി
അന്വേഷിക്കുന്നു.
നിങ്ങള്‍ കുറച്ച്
ഡാറ്റ നല്‍കിയിരിക്കുന്നു.
നിങ്ങള്‍ ചെയ്യേണ്ട
ആദ്യത്തെ കാര്യം
ഒരു ഡാറ്റയുടെ ഗുണനിലവാരം
നോക്കൂ.
നിങ്ങള്‍ക്ക് പ്രതീക്ഷിക്കാവുന്ന
ഫലങ്ങളുടെ സ്വഭാവം
എത്രമാത്രം ഗുണം
ചെയ്യും എന്നതിനെക്കുറിച്ചുള്ള
അവബോധമായ വിലയിരുത്തല്‍
നടത്തുക.
ഡാറ്റ നിലവാരം വളരെ
മോശമാണ്.
എങ്കില്‍ നിങ്ങള്‍
ഡാറ്റ മടക്കി നല്ലത്

Tamil: 
இந்த சராசரி ஒரு
எர்கோடிக் (ergodic) செயல்முறை
மற்றும் அதனால் என்ன
என்று வரையறுக்க
பயன்படுத்தப்படுகின்றன;
நாம் அதற்கு போகமாட்டோம்.
கடைசியாக, இரு பகுதிகள்
சார்பு மற்றும் மாறுபாடு
ஆகியவை டேட்டா அனாலிசிஸ்
(Data Analysis)ல் மிகவும்
முக்கியத்துவம்
வாய்ந்தவை, ஏனென்றால்
அவை சில அளவுருக்கள்
அல்லது அளவுருக்கள்
தொகுப்பை மதிப்பிடுவதில்
உள்ள பிழைகளைப் பற்றி
பேசுகின்றன.
பகுத்தறிவு ஒரு முடிவுக்கு
வரும் ஒரு முறையான
பிழை; ஒவ்வொரு மதிப்பீடும்
பயிற்சி பிழை என்று
ஒரு மதிப்பீடு கொடுக்கும்;
அது பற்றி சந்தேகம்
இல்லை.
கேள்வி என்னவென்றால்,
மதிப்பீடு மற்றும்
உண்மையைப் பொறுத்து
மாறுபாடு அல்லது
உங்கள் மதிப்பீட்டாளரின்
சில குறைபாடு அல்லது
குறைபாடு காரணமாக
வித்தியாசம் உள்ளது.
உங்கள் மதிப்பீடு
பயிற்சி அல்லது உங்கள்
மதிப்பீட்டில் பகைமை
இருந்தால் உங்களுக்கு
எப்படி தெரியும்?
இந்த சிந்தனை செயல்முறையை
கற்பனை செய்து பாருங்கள்;
நூறு தரவு பதிவுகள்
அல்லது ஆயிரம் டேட்டா
என்ட்ரிஸ் (Data entries),
டேட்டா அனாலிசிஸ்
(Data Analysis) அல்லது ஆயிரம்
டேட்டா என்ட்ரிஸ்
(Data entries) ஒரு செயல்முறைக்கு
என்று நான் சேகரித்தேன்,
டேட்டா என்ட்ரிஸ்
(Data entries) ஒவ்வொன்றிற்கும்
மாதிரியை நான் கணக்கிடுகிறேன்.
நான் சராசரியாக,
ஆயிரம் கூட இல்லை,
ஒரு மில்லியன் டேட்டா
என்ட்ரிஸ் (Data entries)களை,
தரவு பதிவு ஒன்றுக்கு
நான் ஒரு மாதிரி

Hindi: 
इसका मतलब यह नहीं
है कि आप एक खतरनाक
तरीके से करने के
बारे में सोचते हैं।
और यह भी याद रखें
कि किसी भी डेटा विश्लेषण
(DATA ANALYSIS)अभ्यास की सफलता
दो चीजों पर निर्भर
करती है: आपके द्वारा
एकत्र किए जाने वाले
डेटा की गुणवत्ता
और व्यवस्थित प्रक्रिया
या आपके पास जो विधियां
हैं, वे टूल जिन्हें
आपने डेटा विश्लेषण
(DATA ANALYSIS)में उपयोग किया
है या संपूर्ण विधि
पद्धति आपके द्वारा
अनुसरण किए गए डेटा
विश्लेषण।
यदि डेटा की गुणवत्ता
खराब है, तो आप ज्यादा
कुछ नहीं कर सकते
हैं।
यहां तक ​​कि यदि
आप व्यवस्थित प्रक्रिया
का पालन करते हैं,
तो आपको आश्चर्यजनक
परिणाम नहीं मिलेंगे;
और यहां तक ​​कि यदि
डेटा की गुणवत्ता
अच्छी है, तो आप एक
बहुत ही अनिश्चित
प्रक्रिया का पालन
करते हैं और आप एक
बहुत ही गरीब अनुमानक
का उपयोग करते हैं,
तो आप एक गरीब अनुमानक
के साथ समाप्त हो
सकते हैं।
तो, दोनों महत्वपूर्ण
हैं।
अब, निश्चित रूप से,
डेटा की गुणवत्ता
हमारे हाथों में
कई बार नहीं है, लेकिन

Marathi: 
आणि पद्धतशीर पध्दत
किंवा आपल्याकडे
असलेल्या पद्धती,
आपण डेटा विश्लेषण
किंवा संपूर्ण पद्धत
पद्धती मध्ये वापरलेल्या
साधनांचा आपण दिलेला
डेटा विश्लेषण जर
डेटाची गुणवत्ता
खराब आहे, तर आपण बरेच
काही करू शकत नाही.
जरी आपण पद्धतशीर
पध्दतीचा अवलंब केला
तरीही आपल्याला आश्चर्यकारक
परिणाम मिळत नाहीत;
आणि जरी डेटाची गुणवत्ता
चांगली असली तरीही,
आपण एक अतिशय अनियमित
पद्धत वापरत आहात
आणि आपण खूपच गरीब
अंदाजपत्रक वापरत
आहात, आपण एका खराब
अंदाजाप्रमाणे निवडू
शकता त्यामुळे, दोन्ही
महत्वाचे आहेत. आता,
अर्थातच, डेटाची
गुणवत्ता बर्याच
वेळा आपल्या हातात
नाहीये, परंतु आपण
डेटा बघताना आणि
म्हणू शकतो की हे
डेटा गुणवत्ता चांगली
नाही म्हणून आपण
सिद्ध होण्याकरता
सिद्धांताची अजूनही
जाणीव ठेवावी, म्हणून
मला चांगले निकाल
मिळू नयेत. समजा, आपण
सल्लागार आहात आणि
आपल्याला काही डेटा
देण्यात आला आहे,
प्रक्रिया उद्योगाने

Gujarati: 
સામાન્ય કવાયત છે,
જ્યાં સંશોધક એ કંઈક
હોવાના સત્યની ચકાસણી
કરે છે. ઉદાહરણ તરીકે,

Kannada: 
ತಾಪಮಾನ ಡೇಟಾವನ್ನು
ಸಂಗ್ರಹಿಸಿ ಸಂಗ್ರಹಿಸುತ್ತೇವೆ.
ನನ್ನ ಮೇಜಿನ ಹಿಂತಿರುಗಿ
ಮತ್ತು ಡೇಟಾವನ್ನು
ನನ್ನ ಕಂಪ್ಯೂಟರ್ ಅಥವಾ
ನನ್ನ ಕ್ಯಾಲ್ಕುಲೇಟರ್ನಲ್ಲಿ
ಫೀಡ್ ಮಾಡಿ ಮತ್ತು
ನಾನು ವಾಸ್ತವವಾಗಿ
ಮಾದರಿಯನ್ನು ಲೆಕ್ಕಾಚಾರ
ಮಾಡುತ್ತೇನೆ.
ಮಾದರಿಯು ನಾನು ಲೆಕ್ಕ
ಹಾಕಿದಷ್ಟೇ ಸರಾಸರಿ
ಎಂದು ಅರ್ಥ; ಏನು ಸರಾಸರಿ?
ಅನಿಶ್ಚಿತತೆಗಳಿಂದ
ದೋಷಪೂರಿತ ಡೇಟಾ. ಆದ್ದರಿಂದ,
ಆ ಅನಿಶ್ಚಿತತೆಯು ನಿಮ್ಮ
ಮಾದರಿಯ ಸರಾಸರಿಗೆ
ಸಹ ದಾರಿ ಮಾಡಿಕೊಟ್ಟಿದೆ.
ಆದ್ದರಿಂದ, ಮಾದರಿಯ
ಮೌಲ್ಯವು ನಿಮಗೆ ಕೆಲವು
ಅನಿಶ್ಚಿತತೆಗಳನ್ನು
ಹೊಂದಿದೆ ಎಂದು ಅರ್ಥ.
ಇಲ್ಲಿನ ಅನಿಶ್ಚಿತತೆಯು
ನಿಮ್ಮ ಲೆಕ್ಕ ದೋಷಕ್ಕೆ
ಸಂಬಂಧಿಸಿದಂತೆ ಅಲ್ಲ;
ಅದು ಪಕ್ಕಕ್ಕೆ ಇಡಬೇಕು.
ಅದರಲ್ಲಿನ ಅನಿಶ್ಚಿತತೆಯು
ಈ ಪ್ರಕ್ರಿಯೆಯ ನಿಜವಾದ

English: 
remember that the success of any data analysis
exercise depends on two things: the quality
of data that you collect and the systematic
procedure or the methods that you have, the
tools that you have used in data analysis
or the entire method methodology of data analysis
that you followed. If the data quality is
bad, you cannot do much. Even if you follow
systematic procedure, you may not get marvellous
results; and even if the quality of data is
good, you follow a very unsystematic procedure
and you use a very poor estimator, you may
end up with a poor estimator. So, both are
important.
Now, of course, quality of data is many a
times is not in our hands, but you should
still be aware of the theory to be able to
say when you look at a data and say that well
this data quality is not good, so I should
not expect good results. Suppose, you are
the consultant, and you have been given some
data, you are hired for the data analysis
by a process industry and you are given some
data, the first thing that you should be doing

Malayalam: 
അത്ഭുതങ്ങള്‍ പ്രതീക്ഷിക്കുന്നില്ല
എന്ന് കരുതണം.
വിവരങ്ങളെ വളരെ മികച്ച
രീതിയില്‍ ശേഖരിക്കേണ്ടതുണ്ട്.
അതിനാല്‍ ഇന്‍ഫോമറ്റീവ്
സംവിധാനമെന്ന് വിളിക്കപ്പെടുന്ന
കാര്യമാണ് അത്. അത്
മനസ്സില്‍ വയ്ക്കുക.
ഇപ്പോള്‍ ഈ വിശകലനത്തിന്‍റെ
തുടക്കത്തില്‍ നിങ്ങള്‍
കണ്ട ചിത്രീകരണം
നാം ഒന്നുകൂടി വിശകലനം
ചെയ്യുന്നു.
ഇത് ഡാറ്റ വിശകലനത്തിന്‍റെ
വ്യവസ്ഥാപിതമായ
പ്രക്രിയയെക്കുറിച്ച്
നമുക്ക് ചില ആശയങ്ങള്‍
നല്‍കുന്നു.
മുകളില്‍ പറഞ്ഞതുപോലെ,
തീര്‍ച്ചയായും, പ്രോസസ്സില്‍
നിന്ന് പുറത്തുവരുന്ന
ഡാറ്റ - സെന്‍സറുകളില്‍
നിന്ന് വരുന്ന ഡേറ്റാ
- വിവര വിശകലനത്തിന്‍റെ
ആദ്യപടിയായി മൂന്ന്
പ്രാഥമിക നടപടികളിലൂടെ
കടന്നുപോകുന്നു:
ദൃശ്യവല്‍ക്കരണം,
ഗുണനിലവാര പരിശോധന,
പ്രീ-പ്രോസസ്സിംഗ്.
അത് ക്രമത്തിലായിരിക്കണമെന്നില്ല.
സാധാരണയായി, ആദ്യപടി
നിങ്ങളുടെ ഡാറ്റ
പ്ലോട്ട് ചെയ്യുകയെന്നതാണ്.
കാരണം നമ്പറുകള്‍
നിങ്ങള്‍ക്ക് അധികം
കാര്യങ്ങള്‍ പറഞ്ഞുതരില്ല.
പക്ഷേ, ചിത്രങ്ങള്‍
നിങ്ങളോട് വളരെയധികം
കാര്യങ്ങള്‍ പറയുകയും
അത് ഊന്നിപ്പറയുന്നതിന്

Marathi: 
डेटा विश्लेषणासाठी
आपल्याला नियुक्त
केले गेले आहे आणि
आपल्याला काही डेटा
दिलेला आहे, आपण करीत
असलेले पहिले एक
डेटा गुणवत्ता पाहण्यासारखे
आहे आणि आपण अपेक्षा
करू शकता अशा परिणामांची
प्रकृती किती चांगली
आहे हे सहजपणे समजून
घ्या. जर डेटाची गुणवत्ता
खूप खराब आहे, तर आपण
डेटा परत करावा आणि
तसेच चमत्कारांची
अपेक्षा करू नका.
माहिती अधिक चांगल्या
पद्धतीने गोळा करणे
आवश्यक आहे, जेणेकरून
माहितीपूर्ण सुचनाही
सांगितले जाते. तर,
हे लक्षात ठेवा. आता,
आम्ही या व्याख्यानाच्या
सुरूवातीला ज्या
योजनेचा आढावा घेतला
त्यात आम्हाला पुन्हा
भेट दिलेला आहे ज्यायोगे
आम्हाला डेटा विश्लेषणाची
पद्धतशीर पद्धत काय
आहे याची कल्पना
येईल. तर, शीर्षस्थानी,
अर्थातच, प्रक्रियेच्या
बाहेर येत डेटा - तसेच
सेन्सर्समधून बाहेर
पडतो - आणि डेटा विश्लेषणातील
पहिला टप्पा काही
प्रारंभिक पावले
ज्यात तीन गोष्टींचा
समावेश असतो: व्हिज्युअलायझेशन,
गुणवत्ता तपासणी,
आणि पूर्व-प्रक्रिया
आता, यामध्ये पुन्हा

Bengali: 
এখন, সাধারণভাবে,
বিশ্লেষণের উদ্দেশ্য
নির্দিষ্ট তালিকা
বিশ্লেষণকে নির্ধারণ
করে যে আমরা এখানে
তালিকাভুক্ত করেছি,
যা আপনি বহন করবেন।
এর অর্থ, মূলত কোন
বিশ্লেষণের শেষ ব্যবহারটি
কী, আপনি যে তথ্যটি
বের করেন তা কীভাবে
ব্যবহার করবেন?
এবং আমরা তথ্য বিশ্লেষণে
এগিয়ে যাওয়ার আগে,

Tamil: 
அர்த்தம் என்று சொல்கிறேன்;
மற்றும் மில்லியன்
டேட்டா என்ட்ரிஸ்
(Data entries)கள், எனவே நான்
மில்லியன் மாதிரி
வழிமுறைகளை வேண்டும்.
நான் மாதிரியை சராசரியாக
எடுத்துக் கொண்டால்,
மில்லியன் மாதிரி
என்பது என்னிடம்
உள்ளது, நான் உண்மையாகவே
மிக நெருக்கமாக இருக்க
வேண்டும்.
மில்லியனுக்கும்
அதிகமான வாய்ப்புகள்
இருந்தால், நான்
உண்மையைப் பெற வேண்டும்,
ஆனால் இந்த மில்லியன்
மாதிரி சராசரிக்கும்
சராசரி அல்லது மாதிரி
அர்த்தம் மற்றும்
சத்தியத்திற்கும்
இடையில் இன்னொரு
வித்தியாசம் இருக்கிறது
என்றால், ஒரு முறையான
பிழை உள்ளது.
நான் மேலே சொன்னது
போல, நாங்கள் பேசிய
இந்த குழு சராசரியாக
எதிர்பார்ப்பு என
அறியப்படுகிறது.
வேறுவிதமாகக் கூறினால்,
மறுபரிசீலனைக்கு
வந்தால், மதிப்பீட்டின்
எதிர்பார்க்கப்பட்ட
மதிப்பானது சத்தியத்திலிருந்து
மாறுபட்டால், மதிப்பீட்டில்
ஒரு சார்பு உள்ளது
என்று நாங்கள் சொல்கிறோம்.
இப்போது, ​​மாறுபாடுக்கு
வருவதால், பல்வேறு
தரவு பதிவுகள் முழுவதும்
மதிப்பீடுகளின்
பரப்பளவு இது. நடைமுறையில்
நான் ஒரே ஒரு டேட்டா
என்ட்ரி (Data entry)டன்
பணிபுரிகிறேன், மேலும்
ஒரு டேட்டா என்ட்ரி
(Data entry)ல் இருந்து எனது
எல்லா தகவல்களையும்
நான் செய்கிறேன்.
நான் தெரிந்து கொள்ள
வேண்டும், கேள்வியின்
பதில் எனக்குத் தெரிந்திருக்க
வேண்டும் - நான் மற்றொரு
டேட்டா என்ட்ரி (Data
entry) சேகரித்தேன்,
டேட்டா என்ட்ரி (Data
entry)ல் இருந்து என்னிடமிருந்து
நான் பெற்ற மதிப்பெண்களைக்
கொண்டிருந்தேன்,

Gujarati: 
ધારો કે હું આજુબાજુના
તાપમાનના ડેટા એકત્રિત
કરું છું. તે મારા
રૂમની બહાર છે, હું

Hindi: 
जब भी आप डेटा देखते
हैं और कहें कि यह
डेटा गुणवत्ता अच्छी
नहीं है, तो आपको अभी
भी सिद्धांत के बारे
में पता होना चाहिए।
मुझे अच्छे नतीजों
की उम्मीद नहीं करनी
चाहिए।
मान लीजिए, आप परामर्श
दाता हैं, और आपको
कुछ डेटा दिया गया
है, आपको एक प्रक्रिया
उद्योग द्वारा डेटा
विश्लेषण (DATA ANALYSIS)के
लिए किराए पर लिया
जाता है और आपको कुछ
डेटा दिया जाता है,
पहली चीज जो आपको
करना चाहिए वह डेटा
की गुणवत्ता को देखता
है और एक सहज मूल्यांकन
करें कि आप जिन परिणामों
की अपेक्षा कर सकते
हैं, उनकी प्रकृति
कितनी अच्छी है।
यदि डेटा की गुणवत्ता
बहुत खराब है, तो आपको
डेटा वापस करना चाहिए
और अच्छी तरह से कहें
चमत्कारों की अपेक्षा
न करें।
डेटा को एक बेहतर
तरीके से एकत्र किया
जाना चाहिए, ताकि
इसे तथाकथित जानकारीपूर्ण
कहा जा सके।
तो, कृपया इसे ध्यान
में रखें।
अब, हम इस व्याख्यान
की शुरुआत में देखे
गए योजनाबद्ध पुनरीक्षण
को देखते हैं जो हमें
डेटा विश्लेषण (DATA
ANALYSIS)की व्यवस्थित
प्रक्रिया के बारे
में कुछ जानकारी
देता है।

English: 
is look at a quality of a data and make an
intuitive assessment of how good are the nature
of the results that you can expect. If the
data quality is too bad, you should return
the data and say well don’t expect miracles.
The data has to be collected in a much better
manner, so that is so-called informative alright.
So, please keep that in mind.
Now, we revisit the schematic that we saw
at the beginning of this lecture which gives
us some idea of what is the systematic procedure
of the data analysis. So, at the top, we have,
of course, the data coming out of the process
- well, out of the sensors - and the first
step in data analysis is going through some
preliminary steps which involves three things:
visualization, quality check, and pre-processing.
Now, again within this, it’s not necessarily
sequential. Generally, the first step is to
plot our data because the numbers may not

Tamil: 
அந்த மதிப்பீடுகள்
இப்போது நான் பார்த்ததில்
இருந்து வேறுபட்டதாக
இருக்கும்.
அவர்கள் வெவ்வேறு,
வெளிப்படையாக, எண்ணிடலாம்,
ஆனால் வித்தியாசம்
மிக அதிகமாக இருக்கும்?
அது மிகப்பெரியதாக
இருந்தால், மதிப்பீடு
அல்லது மதிப்பீட்டில்
ஒரு பெரிய வேறுபாடு
இருப்பதாக நாங்கள்
கூறுகிறோம்.
இந்த காரணத்திற்காக,
மாறுபாடு மேலும்
துல்லியமாக குறிப்பிடப்படுகிறது.
மதிப்பீட்டில் குறைவான
மாறுபாடு, மதிப்பீட்டாளர்
மிகவும் துல்லியமானது.
மாறாக, சார்புகள்
துல்லியத்தை அளவிடுகின்றன.
குறைபாடு குறைவு,
குறைவான துல்லியம்.
உண்மையில், ஸிரோ
(zero) சார்பு என்பது
ஒரு துல்லியமானது;
ஒரு துல்லியமான மதிப்பீடு
கொடுக்கிறது.
நீங்கள் ஒரு துல்லியமான
மதிப்பீட்டாளர்.
பொதுவாக, நாம் மாறுபாடு
பற்றி அதிகம் கவலைப்படுகிறோம்.
ஆம், நிச்சயமாக துல்லியமான
மதிப்பீட்டை நாங்கள்
விரும்புகிறோம்;
வெறுமனே, நாம் ஒரு
துல்லியமான மதிப்பீடு
வேண்டும்.
வரையறுக்கப்பட்ட
மாதிரிகள் இருந்து
ஒரு துல்லியமான மதிப்பீடு
பெற முடியும், ஆனால்
நிச்சயமாக நாம் குறைந்தபட்சம்
சார்பற்ற அல்லது
ஸிரோ (zero) சார்பு முடியும்
என்றால் முடிந்தவரை
சிறிய அல்லது குறைந்த
பிழை. அதனால்தான்,
ஆய்வகங்களுக்கு
வழங்கப்படும் பல
கருவிகளில் நீங்கள்
பார்க்கிறீர்கள்,
இந்த கருவிகளும்
உயர் துல்லியமான
கருவிகளாக தகுதி
பெற்றுள்ளன.
நினைவில் வைத்து
கொள்ளுங்கள், மதிப்பீடு
தரவுகளில் ஒரு கணித
சூத்திரத்தைப் பயன்படுத்துவது
மட்டுமல்ல.
உண்மையில் ஒரு சென்சார்
(sensor) கூட, அதை நீங்கள்
கொடுக்கும் வாசிப்பு
சத்தியத்தின் மதிப்பீடாகும்.

Marathi: 
अनुक्रमिक नाही.
साधारणपणे, पहिला
टप्पा म्हणजे आपला
डेटा प्लॉट करणे
कारण संख्या आपल्याला
जास्त सांगू शकत
नाही, परंतु चित्रे
तुम्हाला आणखी काही
सांगतात आणि त्यावर
जोर देतात की आपण
प्रत्यक्षात येथे
स्लाइडवर नेऊ.
Anscombe डेटा सेट काय
आहे यावर आधारित
हा एक अतिशय शास्त्रीय
उदाहरण आहे. आणि हे
डेटा सेट आर मध्ये
उपलब्ध आहे जेव्हा
आपण स्थापित करता
तेव्हा त्यासोबत
येतात.
आता, या प्रश्नाचं
उत्तर सुंदर आहे
... मी तुम्हाला इथे
दाखवतो ते समजावून
सांगतो.
व्हेरिएबल्सची जोडणी
करण्यासाठी येथे
मी चार डेटा सेट करतो.
x 1 y 1, x 2 y 2, x 3 y 3 आणि x 4 y
4 चा विचार करतात.
ते सर्व दृष्टि वेगवेगळे
दिसतात; तथापि, आपण
डेटा बघितला नसेल
आणि आपण गणना केली
असेल, उदाहरणार्थ,
याचा अर्थ किंवा

Bengali: 
উপলব্ধ বিভিন্ন ধরনের
ডেটা সম্পর্কে জানতে
খুব দরকারী হতে পারে,
কারণ প্রাথমিকভাবে
আমি পরে উল্লেখ করব,
টুলগুলি, ব্যাখ্যাগুলি
এবং তাই অনেক অন্যান্য
পদক্ষেপ তথ্য প্রকৃতির
উপর নির্ভর করে।
এখন আবার, যখন আপনি
তথ্য বিশ্লেষণ সাহিত্য
চালু, আপনি শ্রেণীবিভাগ
বিভিন্ন ধরনের পাবেন,

Kannada: 
ಅರ್ಥವಾಗಿದೆಯೆ ಎಂದು
ನಿಮಗೆ ಖಾತ್ರಿಯಿಲ್ಲ
ಎಂಬ ಸತ್ಯವನ್ನು ಮಾಡಬೇಕಾಗಿದೆ;
ಅದು ಅನಿಶ್ಚಿತತೆ.
ನೀವು ಸಂಗ್ರಹಿಸಿದ
ಡೇಟಾವನ್ನು ಹೊಂದಿದೆ
.. ಏಕೆಂದರೆ ನೀವು ಸಂಗ್ರಹಿಸಿದ
ಸಾಧ್ಯವಿರುವ ಅನೇಕ
ಡೇಟಾ ಸಂಗ್ರಹಗಳಲ್ಲಿ
ಒಂದಾಗಿದೆ.
ಆದ್ದರಿಂದ, ನೀವು ಮಾದರಿಯ
ಅರ್ಥವನ್ನು ಹೊಂದಿದ್ದೀರಿ,
ಅದು ನಿಮಗೆ ಸಾಧ್ಯವಾದಷ್ಟು
ಸಂಭವನೀಯ ಮಾದರಿಯ ವಿಧಾನವಾಗಿದೆ.
ನೀವು ಇಳಿಜಾರು, ಅಡ್ಡಿ
ಅಥವಾ ಯಾವುದೇ ಪರಸ್ಪರ
ಸಂಬಂಧವನ್ನು ಅಂದಾಜು
ಮಾಡುತ್ತಿದ್ದೀರಾ
ಎಂದು ಯಾವುದೇ ಪ್ಯಾರಾಮೀಟರ್
ಅಂದಾಜು ಮಾಡಲು ಇದು
ನಿಜವಾಗಿದೆ, ಸಂಭವನೀಯ
ಡೇಟಾದಿಂದ ನೀವು ಅಂದಾಜು
ಮಾಡಬಹುದಾದ ಯಾವುದೇ
ಸಂಕೀರ್ಣವಾದ ಪ್ಯಾರಾಮೀಟರ್,
ಡೇಟಾದಲ್ಲಿ ದೋಷವಿದೆ
ಎಂದು ನೀವು ನೆನಪಿಸಿಕೊಳ್ಳಬೇಕು,
ಮತ್ತು ವಿಶ್ಲೇಷಕ,
ದೋಷದ ಗಾತ್ರ ಅಥವಾ

Hindi: 
तो, शीर्ष पर, हमने
निश्चित रूप से प्रक्रिया
से बाहर आने वाले
डेटा को देखा है - ठीक
है, सेंसर से बाहर
- और डेटा विश्लेषण
(DATA ANALYSIS)में पहला कदम
कुछ प्रारंभिक चरणों
में जा रहा है जिसमें
तीन चीजें शामिल
हैं: विज़ुअलाइजेशन,
गुणवत्ता जांच, और
पूर्व प्रसंस्करण।
अब, इसके भीतर, यह
जरूरी अनुक्रमिक
नहीं है।
आम तौर पर, पहला कदम
हमारे डेटा को साजिश
करना है क्योंकि
संख्याएं आपको बहुत
कुछ नहीं बता सकती
हैं, लेकिन चित्र
आपको बहुत कुछ बताते
हैं और जोर देते हैं
कि मुझे वास्तव में
आपको स्लाइड पर ले
जाने दें।
यह एक बहुत ही शास्त्रीय
उदाहरण है जो Anscombe
डेटा सेट के नाम से
जाना जाता है।
और यह डेटा सेट आर
में भी उपलब्ध है
क्योंकि आपके द्वारा
इंस्टॉल किए जाने
पर कई डेटा सेट आते
हैं।
अब, इस Anscombe डेटा सेट
की सुंदरता है ... मुझे
बताएं कि मैं आपको
यहां क्या दिखाता
हूं।
मेरे पास चर के जोड़े
के चार डेटा सेट हैं;
एक्स 1 वाई 1, एक्स 2
वाई 2, एक्स 3 वाई 3 और

Gujarati: 
એક સેન્સર(sensor) લવ છું
અને લગભગ એક કલાક
અથવા તેથી વધારે
માટે આસપાસના તાપમાન

Malayalam: 
ഞാന്‍ നിങ്ങളെ ഇവിടെ
സ്ലൈഡിലേക്ക് കൊണ്ടുപോകുന്നു.
അിരെീായല ഡാറ്റ സെറ്റ്
എന്താണെന്നതിനെ
അടിസ്ഥാനമാക്കിയുള്ള
ഒരു വളരെ മികച്ച
ഉദാഹരണമാണിത്.
ഈ ഡാറ്റ സെറ്റ് നിങ്ങള്‍
ഇന്‍സ്റ്റാള്‍ ചെയ്യുമ്പോള്‍
അതിലെ നിരവധി ഡാറ്റ
സെറ്റുകള്‍ R ല്‍
ലഭ്യമാണ്.
ഇപ്പോള്‍, ഈ അിരെീായല
ഡേറ്റാ സെറ്റ് എന്ത്
മനോഹരം ആണ് ٹ ഇവിടെ
ഞാന്‍ നിങ്ങള്‍ക്ക്
എന്താണ് കാണിക്കുന്നതെന്ന്
പറയാം.
എനിക്ക് ഇവിടെ നാല്
ഡാറ്റാ സെറ്റുകള്‍
ഉണ്ട്.
വേരിയബിള്‍ ജോഡികള്‍
: x1 y1, x2 y2, x3 y3, x4y4വയാണെന്ന്
കരുതുക.
അത് കാഴ്ചയില്‍ വ്യത്യസ്തരാണ്.
എന്നാല്‍ നിങ്ങള്‍
ഡാറ്റ നോക്കി കണക്ക്
കൂട്ടിയെങ്കില്‍
ഉദാഹരണത്തിന്, mean
or Variance അല്ലെങ്കില്‍
അനുയോജ്യമായ ജോടികള്‍ക്കിടയില്‍
നിങ്ങള്‍ ഒരു മാതൃകയുണ്ടാക്കും.
അല്ലെങ്കില്‍ ഒരു
പരസ്പരബന്ധത്തില്‍

Malayalam: 
കണക്കു കൂട്ടുകയാണെങ്കില്‍
അത് എല്ലാം ഒരേ തരമായിരിക്കും.
അതിനാല്‍, വിവരണാത്മക
സ്ഥിതിവിവരക്കണക്കുകള്‍
അല്ലെങ്കില്‍ നിങ്ങളുടെ
പിന്‍വാങ്ങള്‍ പോലും
അടിസ്ഥാനമാക്കി,
ഈ നാല് ഡാറ്റ സെറ്റുകളില്‍
നിങ്ങള്‍ക്ക് വ്യത്യാസമുണ്ടാക്കാന്‍
കഴിയില്ല.
എന്നിരുന്നാലും
നിങ്ങള്‍ക്ക് കാണാനാകുന്നതുപോലെ,
ഓരോ ഡാറ്റയുടെയും
സവിശേഷതകളില്‍ അത്തരം
വിപുലമായ വ്യത്യാസമുണ്ട്.
ഉദാഹരണത്തിന് നിങ്ങള്‍
ഡാറ്റ സെറ്റ് 2 നോക്കിയാല്‍,
ഒരു പാരാബയോളജിക്കല്‍
ബന്ധം ഉണ്ട്.
ഡാറ്റാ സെറ്റ് 4 അതേസമയം,
എല്ലാ പോയിന്‍റുകളും
ഒരു നേര്‍രേഖയില്‍
വീണു. പ്രായോഗികമായി
x മാറ്റം ഒന്നും തന്നെയില്ല.
yഎന്നത് വ്യത്യാസപ്പെടുന്നു.
അതിനാല്‍, നിങ്ങളുടെ
ഡാറ്റ വിശകലനത്തിന്
എന്ത് സംഭവിക്കുമെന്ന്
നിങ്ങളെ കാണിക്കാന്‍
ഈ ഡാറ്റ സെറ്റ് വളരെ
ഉപയോഗപ്രദമാണ്.
Outliers എന്നാല്‍ ഡാറ്റ
പോയിന്‍റുകള്‍ സാധാരണ
സ്ഥലത്ത് നിന്നും
വീഴുന്ന പോയിന്‍റുകളാണ്.
സത്യത്തില്‍ നിങ്ങള്‍
ഡാറ്റ സെറ്റ് 3 നോക്കിയാല്‍,

Hindi: 
एक्स 4 वाई 4 के बारे
में सोचें।
वे सभी दृष्टि से
बहुत अलग दिखते हैं;
हालांकि, यदि आपने
डेटा को नहीं देखा
है, और आपने गणना की
है, उदाहरण के लिए,
मतलब या भिन्नता
या आप संबंधित जोड़ों
या एक सहसंबंध पर
गणना के बीच एक मॉडल
फिट कर चुके हैं, तो
वे सभी समान होंगे,
वे सभी एक जैसे होंगे।
इसलिए, वर्णनात्मक
आंकड़ों या यहां
तक ​​कि आपके प्रतिगमन
के आधार पर, आप इन
चार डेटा सेटों के
बीच कोई भेद नहीं
कर पाएंगे।
हालांकि, जैसा कि
आप देख सकते हैं, इस
डेटा में से प्रत्येक
की विशेषताओं में
इतना अंतर है।
उदाहरण के लिए, यदि
आप डेटा सेट 2 को देखते
हैं, तो एक असाधारण
प्रकार का रिश्ता
होता है, जबकि डेटा
सेट 4 होता है, सभी
बिंदु सीधे रेखा
पर पड़ते हैं।
व्यावहारिक रूप से,
एक्स में कोई बदलाव
नहीं है, केवल वाई
एक बाहरी से अलग हो
रहा है।
इसलिए, यह डेटा सेट
आपको यह दिखाने के
लिए भी बहुत उपयोगी
है कि आपके डेटा विश्लेषण

Kannada: 
ಅಂದಾಜಿನ ಅನಿಶ್ಚಿತತೆ
ಅಥವಾ ನೀವು ಸೆಳೆಯುತ್ತಿರುವ
ನಿರ್ಣಯವನ್ನು ಲೆಕ್ಕಾಚಾರ
ಮಾಡಲು ವಿಶ್ಲೇಷಕನ
ಜವಾಬ್ದಾರಿ.
ಅದು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ
ಒಂದು ಪ್ರಮುಖ ಭಾಗವಾಗಿದೆ.
ಈ ಸಂದರ್ಭದಲ್ಲಿ, ನೀವು
ಅಂದಾಜು ವಿಧಾನವನ್ನು
ಆರಿಸಿಕೊಳ್ಳಬೇಕು,
ಅದು ನಿಮಗೆ ಸಾಧ್ಯವಾದಷ್ಟು
ಸಣ್ಣ ದೋಷದೊಂದಿಗೆ
ಅಂದಾಜನ್ನು ನೀಡುತ್ತದೆ
ಮತ್ತು ನಾವು ಅದನ್ನು
ಸ್ವಲ್ಪ ಹೆಚ್ಚು ವಿವರವಾಗಿ
ಮಾತನಾಡುತ್ತೇವೆ.
ಹೆಚ್ಚು ಮುಖ್ಯವಾಗಿ
ನೀವು ಹೆಚ್ಚು ಹೆಚ್ಚು
ವೀಕ್ಷಣೆಗಳನ್ನು ಸಂಗ್ರಹಿಸಿದಾಗ,
ನಿಮ್ಮ ಅಂದಾಜಿನ ದೋಷವು
ಕುಗ್ಗುವಿಕೆಯನ್ನು
ಪ್ರಾರಂಭಿಸುತ್ತದೆ
ಮತ್ತು ಅನಂತತೆಗೆ ಹೋಗುವಾಗ
ಶೂನ್ಯ ಅಸಂಪಾತಕ್ಕೆ
ಹೋಗಬೇಕು.
ಆದ್ದರಿಂದ, ಇವುಗಳು
ಕೆಲವು ಮಾನದಂಡಗಳು
ಮತ್ತು ಆಗಾಗ್ಗೆ ಅನೇಕ
ಸಂಶೋಧಕರು ಈ ಬಗ್ಗೆ
ತಿಳಿದಿರುವುದಿಲ್ಲ.

Gujarati: 
ભેગા કરું છું. અને
હું પાછો આવીને કહું
છું કે એક કલાકમાં
સરેરાશ તાપમાન 25 ડિગ્રી

Tamil: 
எனவே, ஒரு மிக பரந்த
காட்சி வேண்டும்.
எனவே, நிறுவனம் அல்லது
உற்பத்தியாளர் என்பது
உற்சாகமான கருவி
கருவி மூலம் என்னவென்றால்,
நீங்கள் மீண்டும்
அதே சென்சார் (sensor)
அளவை அளவிட வேண்டியிருந்தால்,
நீங்கள் மிகவும்
மாறுபாடுகளைக் காணமாட்டீர்கள்.
நிச்சயமாக சில வேறுபாடுகள்
இருக்கும்.
எனவே, ஒரு வெப்பமானி
எடுத்து, அதை உங்கள்
உடலில் வைக்கவும்,
மற்றும் வாசிப்பு
எடுக்கவும்.
வாசிப்பு கீழே குறிப்பு.
மீண்டும், வெப்பமானி
எடுத்து, உடலின்
அதே பகுதியில் அதை
வைத்து வாசிப்பு
எடுக்க.
தெர்மோமீட்டர்கள்
(thermometer) முதல் தசமத்திற்கு
அப்பால் அறிக்கையிடாத
காரணத்தால், நீங்கள்
ஒருவேளை அதே வாசிப்பைப்
பார்ப்பீர்கள், ஆனால்
நீங்கள் தெர்மோமீட்டர்கள்
(thermometer) அறிக்கை செய்தால்,
நான்காவது அல்லது
ஐந்தாவது தசமமாக
இருக்கலாம் என நீங்கள்
ஒரு உண்மையான மாறுபாடாக
இருக்கலாம்.
இது கருவி தீர்மானத்தை
அழைக்கப்படுகிறது.
ஆனால், எப்படியிருந்தாலும்,
அதே மாதிரியின் அளவை
நீங்கள் மறுபரிசீலனை
செய்ய வேண்டும்,
ஆனால் அந்த அளவீடுகளில்
பரந்த வேறுபாடுகள்
தேவையில்லை.
எனவே, நீங்கள் ஒரு
உயர் துல்லியமான
கருவி வேண்டும்.
எனவே, நாம் நெருக்கமான
சொல் அல்லது முக்கிய
சொற்பொழிவுக்கு
வருகிறோம்.
நிச்சயமாக, ஒருவர்
அறிந்திருக்க விரும்பும்
பல சொற்கள் உள்ளன,
ஆனால் அவை அடிப்படைகள்.
தரவு பகுப்பாய்வுக்காக
பின்பற்ற வேண்டிய
செயல்முறையுடன்
விரிவுரையை முடித்துவிடுவோம்.
பின்னர், ஆர் (R) இல்
உள்ள எடுத்துக்காட்டுக்குரிய
சில எடுத்துக்காட்டுகளுக்குச்
செல்லுங்கள்.

English: 
tell you much, but pictures tell you a lot
more and to emphasize that let me actually
take you to the slide here.
This is a very classical example based on
what is known an Anscombe data set. And this
data set is also available in R as many data
sets that come with it when you install. Now,
the beauty of this Anscombe data set is…
let me explain what I show you here. I have
four data sets here, of pairs of variables;
think of x 1 y 1, x 2 y 2, x 3 y 3 and x 4
y 4. They all look visually very different;
however, if you had not looked at the data,
and you had computed, for example, mean or
variance or you had fit a model between the
respective pairs or compute at a correlation,
they would all be identical, they would all

Bengali: 
ক্লাসিফাইড একটি
সংখ্যা বিদ্যমান।
উদাহরণস্বরূপ, আপনি
সংখ্যাসূচক আয়াতগুলি
নিখুঁত শ্রেণীবিন্যাস
বা স্থির রাজ্যের
আয়াতগুলি গতিশীল
এবং এমনটি পেতে পারেন,
তবে আমি সত্যিই তাদের
বিষয়ে কথা বলতে
যাচ্ছি না, কারণ এটি
অবশ্যই গুরুত্বপূর্ণ,
তবে আরো গুরুত্বপূর্ণ
যা মানুষ প্রায়ই
উপেক্ষা করে, কমপক্ষে
নবীনদের মধ্যে ডেটা

Marathi: 
फरक किंवा आपण संबंधित
जोड्यांमध्ये किंवा
मॉडेलमध्ये एक संबंध
जुळला होता तर ते
सर्व सारखेच असतील,
ते सर्व एकसारखेच
होईल. म्हणून, वर्णनात्मक
आकडेवारीवर किंवा
आपल्या प्रतिगमनवर
आधारित, आपण या चार
डेटा सेट दरम्यान
कोणताही फरक ठेवण्यास
सक्षम नसता. तथापि,
आपण पाहू शकता की,
या प्रत्येक डेटाच्या
वैशिष्ट्यांमध्ये
इतकी मोठी फरक आहे.
उदाहरणार्थ, जर आपण
डेटा सेटकडे पाहिले
तर 2, परस्परसंबंधांचा
संबंध असतो, तर डेटा
सेट 4, सर्व बिंदु
एका सरळ रेषावर पडतात.
व्यवहारात, x मध्ये
काहीही बदल होत नाही,
फक्त y एकापेक्षा
वेगळा बदलत आहे. तर,
डेटा अॅटिअरी आपल्या
डेटा विश्लेषणासाठी
काय करू शकते हे दर्शविण्यासाठी
देखील अतिशय उपयुक्त
आहे. आउटलाइअर हा
डेटा पॉइंट जे सर्वसाधारण
बाबींमधून बाहेर
पडतात किंवा क्षेत्रातून
बाहेर पडले जेथे
उर्वरित डेटा. खरं
तर, आपण डेटा सेट 3
वर पहात असल्यास,
सर्व डेटा बिंदू
सरळ रेखेवर असतात

Marathi: 
जे एका डेटा पॉईंटवर
आधारित आहेत जे एक
बाहेरील अधिकार आहे.
तर, जेव्हा आपण वर्णनात्मक
आकडेवारी एकट्याने
पहाता तेव्हा दोन
डेटा संच पूर्णपणे
एकसारखे दिसू शकतात,
आणि जेव्हा आपण ती
प्लॉट करता तेव्हा
आपल्याला माहित असते
की एक मोठा फरक आहे
आणि मग, नक्कीच, आम्ही
सुधारात्मक कारवाई
करू आणि योग्य ती
वैशिष्ट्ये काढू
शकू. म्हणूनच, अशी
आशा आहे की कोणत्याही
डेटा विश्लेषणापूर्वी
डेटाचे दृश्यमान
करण्याची ही गरज
आहे. आणि मग, नक्कीच,
आम्ही एक गुणवत्ता
तपासणी केली उदाहरणार्थ,
आम्ही बाह्यरेषेच्या
उपस्थितीचे निरीक्षण
केले ते फार महत्वाचे
आहे. बर्याच वेळा
डेटा गहाळ मूल्यांसह
असतो. गहाळ मूल्यांसह
व्यवहार कसे करायचे
हे तुम्हाला ठरवावे
लागेल.
आपण त्याऐवजी बदलू
किंवा त्याच्याशी
राहणे, परस्परसंवादी,
इत्यादींवर संपूर्ण
सिद्धान्त उपलब्ध
आहे. तर हे स्पष्ट
आहे की, याबद्दल येथे
बोलणे शक्य नाही.
आणि मग, इतर प्रकारचे
प्री-प्रसंस्करण

Bengali: 
বিশ্লেষণ প্রায়ই
উপেক্ষা করা হয়
নির্ধারক আয়াত র্যান্ডম
বা স্টোরেচস্টিক
তথ্য এই শ্রেণীবিভাগ।
এটা অত্যন্ত গুরুত্বপূর্ণ,
কারণ তত্ত্বগতভাবে
নিজেই বা তত্ত্ব
নিজেই বেশিরভাগ সময়ই
আপনার মতামত প্রকাশ
করে যে ডেটা একটি
নির্ধারক আয়াত স্টচাস্টিক
প্রক্রিয়া থেকে
বেরিয়ে এসেছে।

English: 
be identical. So, based on the descriptive
statistics or even your regression, you would
not be able to make any distinction between
these four data sets. However, as you can
see, there is such a wide difference in the
features of each of this data. For example,
if you look at the data set 2, there is a
parabolic kind of relationship, whereas data
set 4, all the points fall on a straight line.
Practically, there is no change in x, only
y is changing apart from one outlier. So,
this data set is also very useful to show
you what outliers can do to your data analysis.
Outliers are those data points that fall out
of the normal thing or that fall out of the
region where the rest of the data. In fact,
if you look at data set 3, all the data points
lie on a straight line except for one data

Tamil: 
நினைவில் கொள்ள வேண்டிய
முக்கிய விஷயம்,
அனாலிசிஸ் (Analysis) நடைமுறைகள்
இயற்கையில் மீண்டும்
இயங்குகின்றன.
படி 1, படி 2, படி 3, படி
4, முடிந்ததை எதிர்பார்க்க
வேண்டாம்.
அது எப்போதுமே அரிதாகவே
இருக்காது.
எனவே, அவை அவசியமான
தொடர் அல்ல, ஆனால்
அதில் ஒரு குறிப்பிட்ட
ஒழுங்கு உள்ளது.
நீங்கள் ஒரு அபாயகரமான
முறையில் செய்யப்போகிறீர்கள்
என்று அர்த்தமல்ல.
மேலும், எந்த தரவு
பகுப்பாய்வு பயிற்சி
வெற்றி இரண்டு விஷயங்களை
பொறுத்து என்பதை
நினைவில்: நீங்கள்
சேகரிக்கும் தரவு
தரம் மற்றும் முறையான
நடைமுறை அல்லது நீங்கள்
கொண்ட முறைகள், நீங்கள்
தரவு பகுப்பாய்வு
பயன்படுத்தப்படும்
கருவிகள் அல்லது
முழு முறை முறை நீங்கள்
தொடர்ந்து வந்த டேட்டா
அனாலிசிஸ் (Data Analysis).
டேட்டா (Data) மோசமாக
இருந்தால், நீங்கள்
அதிகம் செய்ய முடியாது.
நீங்கள் முறையான
நடைமுறையை பின்பற்றினாலும்
கூட, நீங்கள் அற்புதமான
முடிவுகளைப் பெற
முடியாது; டேட்டா
(Data)வின் தரம் நன்றாக
இருந்தால் கூட, நீங்கள்
மிகவும் சிக்கலான
செயல்முறையை பின்பற்றுகிறீர்கள்,
நீங்கள் மிக மோசமான
மதிப்பீட்டாளரைப்
பயன்படுத்துகிறீர்கள்,
நீங்கள் ஒரு மோசமான
மதிப்பீட்டாளருடன்
முடிவுக்கு வரலாம்.
எனவே, இருவரும் முக்கியம்.
இப்போது, ​​நிச்சயமாக,
டேட்டா (Data)வின் தரம்
பல முறை நம் கைகளில்
இல்லை, ஆனால் நீங்கள்
ஒரு டேட்டா (Data)வைப்
பார்த்து, இந்த டேட்டா

Hindi: 
(DATA ANALYSIS)में आउटलेटर्स
क्या कर सकते हैं।
आउटलाइजर्स वे डेटा
पॉइंट हैं जो सामान्य
चीज़ से बाहर आते
हैं या जो उस क्षेत्र
से बाहर आते हैं जहां
शेष डेटा होता है।
वास्तव में, यदि आप
डेटा सेट 3 को देखते
हैं, तो सभी डेटा पॉइंट
एक डेटा बिंदु को
छोड़कर एक सीधी रेखा
पर झूठ बोलते हैं
जो एक बाहरी अधिकार
है।
इसलिए, जब आप अकेले
वर्णनात्मक आंकड़े
देखते हैं, तो दो डेटा
सेट पूरी तरह से समान
दिखते हैं, जबकि जिस
क्षण आप उन्हें साजिश
करते हैं, आपको पता
है कि इसमें एक बड़ा
अंतर है।
और फिर, ज़ाहिर है,
हम सुधारात्मक कार्रवाई
और सुविधाओं को सही
तरीके से निकालने
में सक्षम होने के
लिए आवश्यक कदम उठाएंगे।
इसलिए, उम्मीद है
कि यह किसी भी डेटा
विश्लेषण (DATA ANALYSIS)से
पहले डेटा को देखने
की आवश्यकता को घर
चलाएगा।
और फिर, ज़ाहिर है,
हमने अभी एक गुणवत्ता
की जांच की है।
उदाहरण के लिए, हमने
आउटलाइर्स की उपस्थिति
देखी।
यह बहुत महत्वपूर्ण
है।
कई बार डेटा गुम मूल्यों
के साथ आता है।

Malayalam: 
ഒരു ഡേറ്റാ പോയിന്‍റ്
ഒഴികെ എല്ലാ ഡാറ്റാ
പോയിന്‍റുകളും ഒരു
നേര്‍രേഖയിലായിരിക്കും.
ആ പോയിന്‍റാണ് ീൗഹേശലൃ.
സ്ഥിരമായ വിവരശേഖരങ്ങളെ
മാത്രം നോക്കുമ്പോള്‍
രണ്ട് ഡാറ്റ സെറ്റുകളും
തികച്ചും ഒരേപോലെതന്നെ
ദൃശ്യമാകാം.
പക്ഷേ, നിങ്ങള്‍
അവയെ പ്ലോട്ട് ചെയ്യുമ്പോള്‍
വലിയ വ്യത്യാസമുണ്ടെന്ന്
നിങ്ങള്‍ക്കറിയാം.
അപ്പോള്‍, തീര്‍ച്ചയായും
ശരിയായി പ്രവര്‍ത്തിക്കാന്‍
ശരിയായ സവിശേഷതകള്‍
എക്സ്ട്രാക്ട് ചെയ്യുന്നതിന്
ആവശ്യമായ നടപടികള്‍
സ്വീകരിക്കുകയും
ചെയ്യും.
അതിനാല്‍, ഏതെങ്കിലും
ഡാറ്റ വിശകലനത്തിന്
മുമ്പ് ഡാറ്റ അതിന്‍റെ
ദൃശ്യവല്‍ക്കരണം
ആവശ്യമാണ്.
തീര്‍ച്ചയായും നിങ്ങള്‍
ഒരു ഗുണനിലവാര പരിശോധന
നടത്തണം.
ഉദാഹരണത്തിന് Outliers
സാന്നിധ്യം ലഭ്യമാണ്.
നഷ്ടമായ മൂല്യങ്ങള്‍
എങ്ങനെ കൈകാര്യം
ചെയ്യണമെന്ന് നിങ്ങള്‍
തീരുമാനിക്കേണ്ടതുണ്ട്.
നിങ്ങള്‍ക്കത് മാറ്റി
പകരം വയ്ക്കണമോ അതോടൊപ്പം
നില്‍ക്കണമോ അതില്‍
ഇടപെടണമോ എന്നതിനൊക്കെ
ഒരുപാട് സിദ്ധാന്തങ്ങള്‍
ഉണ്ട്.

Kannada: 
ಆದ್ದರಿಂದ, ನಾವು ಈ
ಉಪನ್ಯಾಸದ ಕೊನೆಯ ಭಾಗವಾದ
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ವಿಧಾನಕ್ಕೆ
ತೆರಳುವ ಮೊದಲು, ಡೇಟಾ
ವಿಶ್ಲೇಷಣೆ ಸಾಹಿತ್ಯದಲ್ಲಿ
ಸಾಮಾನ್ಯವಾಗಿ ಕಂಡುಬರುವ
ಕೆಲವು ಪರಿಭಾಷೆಗಳೊಂದಿಗೆ
ಕನಿಷ್ಠವಾಗಿ ನಿಕಟತೆಯನ್ನು
ಪಡೆಯುವುದು ಮುಖ್ಯವಾಗಿದೆ.
ಇಲ್ಲಿ, ನಾವು ನಿರ್ಣಾಯಕ
ಪ್ರಕ್ರಿಯೆಯಿಂದ ಬರುವ
ಡೇಟಾವನ್ನು ನಿಭಾಯಿಸಲಿದ್ದೇವೆ
ಎಂದು ಪ್ರಾಥಮಿಕವಾಗಿ
ಊಹಿಸಲಿದ್ದೇವೆ, ಏಕೆಂದರೆ
ಇದು ಎಲ್ಲೆಡೆ ಪ್ರಚಲಿತ
ಪರಿಸ್ಥಿತಿಯಾಗಿದೆ.
ನೀವು ನಿರ್ಣಾಯಕ ಮತ್ತು
ಸಂಭವನೀಯ ಪ್ರಕ್ರಿಯೆಯ
ಮಿಶ್ರಣವನ್ನು ಹೊಂದಿದ್ದರೂ,
ಈ ಪರಿಭಾಷೆಗಳು ಅನ್ವಯಿಸುತ್ತವೆ.
ಆದ್ದರಿಂದ, ನಾವು ಪರಿಚಿತವಾಗಿರುವಂತಹ
ಮೊದಲ ಪರಿಭಾಷೆ ಪದ
- ಜನಸಂಖ್ಯೆ ಮತ್ತು
ಮಾದರಿ.
ನಾವು ಮೊದಲೇ ಹೇಳಿದಂತೆ
ಸಂಭವನೀಯ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ,
ನಾವು ಡೇಟಾ ದಾಖಲೆಯನ್ನು
ಪಡೆದಾಗ ನಾವು ವೀಕ್ಷಿಸುತ್ತೇವೆ,

Gujarati: 
સેલ્સિયસ છે. હવે
આ એ સાચું છે કે હું
સરેરાશ તાપમાન માટે
અનુકૂળ છું. અને પૂર્વધારણા

Marathi: 
जे आपण करायला हवे
उदाहरणार्थ, आपल्याला
बहुविध प्रक्रियांमध्ये
टाइम स्टॅम्प समक्रमित
करावे लागू शकतात;
जिथे आपण वेगवेगळ्या
व्हेरिएबल्सवरून
डेटा गोळा करता, आपल्याला
वेळ स्टॅम्प समक्रमित
करावे लागतील किंवा
काहीवेळा एक वेरियेबल
एक नमूना दराने गोळा
केला जातो, दुसर्या
वेरियेबल दुसर्या
नमूना दराने गोळा
केला जातो, नंतर आपल्याला
पूर्व-प्रक्रिया
कशी करावी हे निर्धारित
करावे लागेल.
काहीवेळा खरं तर,
खूप वेळा डेटा आवाज
येतो आणि आपल्याला
इतर कोणत्याही पाऊलापूर्वी
आवाज काढून टाकणे
आवश्यक आहे जेणेकरुन
आपण विश्लेषण म्हणून
घेऊ शकता, कारण आवाज
खरोखरच आम्ही काढलेल्या
निष्कर्षांचे अपहरण
करू शकतो. हे लक्षणीय
डेटा विश्लेषण अर्थातच
प्रभावित करू शकते.
तर, आपण ध्वनी काढून
टाकू शकतो. तर, या
प्राथमिक प्रक्रियेत
आपण वेळ काढण्याची
अनेक कारणे आहेत,
जे कदाचित सर्वात
महत्वाचे आहेत. काही
थोडी ... यात थोडी कष्टाची
गोष्ट आहे. हे खरोखर

Kannada: 
ನಮಗೆ ಹೊಂದಿರುವ ಡೇಟಾದ
ದಾಖಲೆಯು ನಮಗೆ ತಿಳಿದಿದೆಅನೇಕ,
ಅನೇಕ ಸಾಧ್ಯತೆಗಳಲ್ಲಿ
ಒಂದಾಗಿದೆ - ಕೆಲವೊಮ್ಮೆ
ಗಣನೀಯವಾಗಿ ಸೀಮಿತವಾಗಿರುತ್ತವೆ,
ಕೆಲವೊಮ್ಮೆ ಗಣನೀಯವಾಗಿ
ಅನಂತ ಅಥವಾ ಅನಂತ - ಅನೇಕ
ಸಂಭವನೀಯ ದತ್ತಾಂಶ
ದಾಖಲೆಗಳು ಅಸ್ತಿತ್ವದಲ್ಲಿವೆ,
ಅದರಲ್ಲಿ ನಾವು ಒಂದುದನ್ನು
ಗಮನಿಸಿದ್ದೇವೆ; ಅದು
ಸಿದ್ಧಾಂತವಾಗಿದೆ,
ಸಂಪೂರ್ಣ ಸಿದ್ಧಾಂತವನ್ನು
ಆ ಪ್ರಮೇಯದ ಮೇಲೆ ನಿರ್ಮಿಸಲಾಗಿದೆ.
ಜನರನ್ನು ನೀವು ನೋಡಬಹುದಾದ
ಎಲ್ಲಾ ಸಾಧ್ಯತೆಗಳನ್ನು
ಸೂಚಿಸುತ್ತದೆ, ಆದರೂ
ನಾವು ಅದನ್ನು ಗಮನಿಸುವುದಿಲ್ಲ;
ಬಹುಪಾಲು ಸಂದರ್ಭಗಳಲ್ಲಿ
ಎಲ್ಲಾ ಸಾಧ್ಯತೆಗಳನ್ನು
ನಿಜವಾಗಿಯೂ ಹೊಂದಲು
ಅಥವಾ ವೀಕ್ಷಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ.
ಆದ್ದರಿಂದ, ಜನಸಂಖ್ಯೆ
ಎಲ್ಲಾ ಘಟನೆಗಳ ಅಥವಾ
ಸಾಧ್ಯತೆಗಳ ಸಂಗ್ರಹವನ್ನು
ಸೂಚಿಸುತ್ತದೆ.
ತಾಪಮಾನದ ಅಳತೆಗೆ ಸಂಬಂಧಿಸಿದಂತೆ
ನಾವು ಮೊದಲಿನ ಪರಿಸರದ
ಬಗ್ಗೆ ಮಾತನಾಡಿದ್ದೇವೆ.

English: 
point that’s an outlier right. So, two data
sets can look completely identical when you
look at descriptive statistics alone, whereas
the moment you plot them, you know there is
a huge difference. And then, of course, we
will take corrective action and the necessary
steps to be able to extract the features correctly.
So, that hopefully this drives home the need
for visualizing data prior to any data analysis.
And then, of course, we just did a quality
check. For example, we observed the presence
of the outliers. That’s very important.
Many a times data come with missing values.
You have to decide how to deal with missing
values. There is a whole lot of theory available
whether you should replace it or live with
it, interpolate, and so on. So obviously,
it’s not possible to talk about it here.
And then, other kinds of pre-processing that
you may have to do. For example, you may have
to sync the time stamps in multivariable processes;
where you collect data from different variables,

Malayalam: 
അതിനാല്‍ വ്യക്തമായും,
ഇവിടെ അതിനെക്കുറിച്ച്
സംസാരിക്കാന്‍ സാധ്യമല്ല.
നിങ്ങള്‍ ചെയ്യേണ്ട
മറ്റ് പ്രീ-പ്രോസസ്സിംഗ്
എന്തൊക്കെയാണ്.
ഉദാഹരണത്തിന് നിങ്ങള്‍
വ്യത്യസ്ത വേരിയബിള്‍
പ്രക്രിയകളില്‍
നിങ്ങള്‍ സമയങ്ങള്‍
സമന്വയിപ്പിക്കേണ്ടിവരും.
ചിലപ്പോള്‍ മറ്റൊരു
സാമ്പിള്‍ നിരക്കുള്ള
ഒരു വേരിയബിള്‍ ശേഖരിക്കേണ്ടി
വരും. പിന്നെ എങ്ങനെ
പ്രീ-പ്രോസസ്സ് നിര്‍ണ്ണയിക്കാന്‍
സാധിക്കും.
ചിലപ്പോഴൊക്കെ, വളരെ
സമയമായി ഡാറ്റ noise
നോടൊപ്പം വരുന്നു.
ഞങ്ങള്‍ വിശകലനത്തിനായി
എടുക്കുന്ന മറ്റേതെങ്കിലും
ഘട്ടത്തിന് മുമ്പ്
തന്നെ അത് നീക്കം
ചെയ്യേണ്ടിവരും.
കാരണം, അത് നമ്മുടെ
അനുമാനങ്ങളെ അപഹരിക്കുന്നു.
ഇത് ഡാറ്റ വിശകലനത്തിന്‍റെ
ഗതിയെ ഗണ്യമായി ബാധിക്കുന്നു.
അതുകൊണ്ട് നമ്മള്‍
noise ഫില്‍ട്ടര്‍ ചെയ്യാന്‍
ആഗ്രഹിക്കുന്നുണ്ടാവും.
അതുകൊണ്ട്, പ്രാരംഭഘട്ടത്തില്‍
സമയം ചെലവഴിക്കാന്‍
നിങ്ങള്‍ക്ക് നിരവധി
പ്രധാനപ്പെട്ട കാരണങ്ങളുണ്ട്.
അതില്‍ മുഴുകിയിരിക്കുന്ന
ഒരു വിരസതയുണ്ട്.
നിങ്ങളുടെ ഞരമ്പുകളിലേക്ക്
അത് പ്രവേശിക്കുന്നു.
ഒരു സുവര്‍ണ്ണ 80/20
നിയമമുണ്ട്.

Tamil: 
(Data) நன்றாக இல்லை
என்று சொல்லும் போது
கோட்பாட்டைப் பற்றி
இன்னும் தெரிந்திருக்க
வேண்டும் நான் நல்ல
முடிவுகளை எதிர்பார்க்க
முடியாது.
நீங்கள் ஆலோசகராக
இருக்கிறீர்கள்
என்று வைத்துக்கொள்ளுங்கள்,
சில தரவுகளை வழங்கியிருக்கிறீர்கள்,
நீங்கள் ஒரு செயல்முறைத்
தொழிற்துறையின்
தரவு பகுப்பாய்வுக்காக
பணியமர்த்தப்பட்டுள்ளீர்கள்,
சில டேட்டா (Data)களை
வழங்குவீர்கள், நீங்கள்
செய்ய வேண்டிய முதல்
விஷயம் டேட்டா (Data)வின்
தரம் மற்றும் நீங்கள்
எதிர்பார்க்கக்கூடிய
முடிவுகளின் இயல்பு
எவ்வளவு நல்லது என்பதை
ஒரு உள்ளுணர்வு மதிப்பீடு
செய்யுங்கள்.
தரவு மிக மோசமாக
இருந்தால், நீங்கள்
டேட்டா (Data)வை திரும்பப்
பெற வேண்டும் மற்றும்
அற்புதங்களை எதிர்பார்க்க
வேண்டாம்.
டேட்டா (Data) மிகச்
சிறந்த முறையில்
சேகரிக்கப்பட வேண்டும்,
எனவே இது தகவல் தொடர்பு
என்று அழைக்கப்படும்.
எனவே, அதை மனதில்
வைத்துக் கொள்ளுங்கள்.
இப்போது, ​​நாம்
இந்த விரிவுரையின்
ஆரம்பத்தில் பார்த்த
தரவுத் திட்டத்தை
மறுபரிசீலனை செய்கிறோம்,
இது டேட்டா அனாலிசிஸ்
(Data Analysis) முறையான நடைமுறை
என்ன என்பதை எங்களுக்கு
சில யோசனைகள் தருகிறது.
எனவே, நிச்சயமாக,
செயல்முறை வெளியே
வரும் - நன்கு, சென்சார்கள்
(sensor) வெளியே - மற்றும்
டேட்டா அனாலிசிஸ்
(Data Analysis) முதல் படியில்
மூன்று விஷயங்களை
உள்ளடக்கிய சில பூர்வாங்க
நடவடிக்கைகள் மூலம்
செல்கிறது: காட்சிப்படுத்தல்,
டேட்டா (Data) சோதனை,
மற்றும் முன் செயலாக்கம்.

Hindi: 
आपको तय करना होगा
कि लापता मूल्यों
से कैसे निपटें।
एक बहुत सारे सिद्धांत
उपलब्ध हैं कि क्या
आपको इसे बदलना चाहिए
या इसके साथ रहना
चाहिए, इंटरपोलेट
करना चाहिए, आदि।
तो जाहिर है, यहां
इसके बारे में बात
करना संभव नहीं है।
और फिर, अन्य प्रकार
के प्री-प्रोसेसिंग
जो आपको करना पड़
सकता है।
उदाहरण के लिए, आपको
बहुआयामी प्रक्रियाओं
में समय टिकटें सिंक
करना पड़ सकता है;
जहां आप विभिन्न
चर से डेटा एकत्र
करते हैं, आपको टाइम
स्टैम्प को सिंक
करना पड़ सकता है
या कभी-कभी एक नमूना
एक नमूना दर पर एकत्र
किया जाता है, एक और
चर एक अन्य नमूना
दर पर एकत्र किया
जाता है, तो आपको यह
निर्धारित करना पड़
सकता है कि प्री-प्रोसेस
कैसे करें।
कभी-कभी, वास्तव में,
कई बार डेटा शोर के
साथ आता है और हमें
किसी अन्य चरण से
पहले शोर को हटाना
पड़ सकता है जिसे
हम विश्लेषण के रूप
में ले सकते हैं, क्योंकि
शोर वास्तव में उन
अनुमानों को हाइजैक
कर सकता है जिन्हें
हम आकर्षित करते

Bengali: 
এখন, অবশ্যই, কিছু
লোক র্যান্ডম শব্দটি
ব্যবহার করে।
র্যান্ডম এবং stochastic
মধ্যে একটি suttle পার্থক্য
আছে; যাইহোক, আমরা
এখানে যে পার্থক্য
পালন করবে না।
কখনও কখনও, শব্দটি
অ-নিয়ন্ত্রক শব্দটি
ব্যবহার করা হয়।
কেন এই শ্রেণিবিন্যাস
বা পার্থক্য গুরুত্বপূর্ণ
কেন আমরা জিজ্ঞাসা
করার আগে, এর সংজ্ঞা
এবং সংজ্ঞা দেখুন
তথ্য উত্পাদন প্রক্রিয়া
উপর ভিত্তি করে।
সুতরাং, নির্ধারক
এবং স্টচাস্টিক ক্যুইভাইফারগুলি

Gujarati: 
પરીક્ષણ તે છે કે
જે દાવો કરે છે કે
હું તે બનાવે છે કે
નહીં તે બનાવી રહ્યો

Bengali: 
প্রতিবেদনের তথ্য
নয়, আসলে এটি, তারা
তথ্য উৎপাদনের প্রক্রিয়ার
জন্য গুণগত যোগ্যতা।
তথ্য বিশ্লেষণে,
ডেটা উৎপাদক প্রক্রিয়া
একটি অত্যন্ত গুরুত্বপূর্ণ
সত্তা।
ডেটা জেনারেটিং প্রসেসের
মাধ্যমে আমরা বোঝাতে
চাই যে প্রক্রিয়াটি
আপনি আপনার পরীক্ষামূলক
প্রক্রিয়া থেকে
তথ্য সংগ্রহ করছেন।
এভাবেই আপনি পরীক্ষাটি
পরিচালনা করেছেন।
সুতরাং, একসাথে রাখা,
সবকিছু তথ্য উত্পাদক
প্রক্রিয়া।
এটি কেবলমাত্র শারীরিক
প্রক্রিয়া নয় যে
আপনি বিশ্লেষণ করছেন।

Hindi: 
हैं।
यह डेटा विश्लेषण
(DATA ANALYSIS)के पाठ्यक्रम
को काफी प्रभावित
कर सकता है।
तो, हम शोर को फ़िल्टर
करना चाहते हैं।
इसलिए, ऐसे कई कारण
हैं जिनसे आप इस प्रारंभिक
चरण में समय बिताना
चाहते हैं जो शायद
सबसे महत्वपूर्ण
है।
कुछ हद तक ... इसमें
शामिल कड़ी मेहनत
है।
यह वास्तव में आपके
नसों पर जा सकता है,
और एक सुनहरा 80/20 नियम
है जो कुल डेटा विश्लेषण
(DATA ANALYSIS)के लिए 100 प्रतिशत
समय के बारे में कहता
है, आपको डेटा प्री-प्रोसेसिंग
पर 80 प्रतिशत समय
बिताना पड़ सकता
है । यही वह प्रयास
है जिसे आपको कभी-कभी
रखना पड़ सकता है।
यदि आप भाग्यशाली
हैं, तो निश्चित रूप
से, आप बस इस चरण के
माध्यम से हवा में
जा सकते हैं।
फिर, निश्चित रूप
से, आपके विश्लेषण
का मुख्य भाग जो मॉडलिंग
या आकलन या अन्वेषणकारी
है या पूर्वानुमानित
प्रकार या अनुवादात्मक
प्रकार का विश्लेषण
निदान हो सकता है
और इसी तरह, जिसके
परिणाम कई अनुप्रयोगों
में फ़ीड करते हैं,
जैसे निगरानी, ​​नियंत्रण,
अनुकूलन , नवाचारों
के रूप में हमने पहले
चर्चा की है।

Gujarati: 
છું, તે ડેટા પર આધારિત
જે મેં એકત્રિત કર્યું
છે. તેથી, જે ડેટા
મેં એકત્રિત કર્યો

Tamil: 
இப்போது, ​​மீண்டும்
இதற்குள், அது தொடர்ச்சியாக
அல்ல. பொதுவாக, முதல்
படி எண்களைக் காட்ட
வேண்டும் என்பதால்
எண்கள் உங்களுக்கு
அதிகம் சொல்லக்கூடாது,
ஆனால் படங்கள் உங்களிடம்
அதிகம் சொல்கின்றன
மற்றும் இங்கே உண்மையில்
ஸ்லைடில் உங்களை
அழைத்துச் செல்வதை
வலியுறுத்துகின்றன.
இது ஆஸ்கோம்பே டேட்டா
செட் (Anscombe data set) தொகுப்பு
அறியப்பட்டதன் அடிப்படையில்
மிகச் சிறந்த எடுத்துக்காட்டாகும்.
இந்த தரவு தொகுப்பு
ஆர் (R) இல் கிடைக்கிறது,
நீங்கள் நிறுவும்
போது பல தரவுத் தொகுப்புகள்
வந்துவிடும்.
இப்போது, ​​இந்த
ஆஸ்கோம்பே டேட்டா
செட் (Anscombe data set) அழகு.
நான் இங்கே விளக்க
வேண்டும்.
நான் இங்கே நான்கு
தரவுகளை அமைக்கிறேன்,
ஜோடிகளின் மாறிகள்;
x 1 y 1, x 2 y 2, x 3 y 3 மற்றும்
x 4 y 4 ஆகியவற்றைக்
கருதுங்கள்.
எனினும், நீங்கள்
தரவைப் பார்த்துக்
கொள்ளவில்லை என்றால்,
நீங்கள் கணக்கிடப்பட்டிருந்தால்,
அதாவது, மாறுபாடு
அல்லது வேறுபாடு
அல்லது அந்தந்த ஜோடிகளுக்கு
இடையே ஒரு மாதிரி
பொருத்தப்பட்டிருக்கலாம்
அல்லது ஒரு கூட்டுறவைக்
கணக்கிட வேண்டும்,
அவர்கள் அனைவரும்
ஒரே மாதிரியாக இருப்பார்கள்,
அவர்கள் அனைவரும்
ஒரே மாதிரியாக இருப்பார்கள்.
எனவே, விளக்க புள்ளிவிவரங்கள்
அல்லது உங்கள் பின்னடைவை
அடிப்படையாகக் கொண்டு,
நீங்கள் இந்த நான்கு

Malayalam: 
അതില്‍ മൊത്തം ഡാറ്റ
വിശകലനത്തിനായി
എടുക്കുന്ന 100 ശതമാനം
സമയത്തില്‍ ഡാറ്റ
പ്രീപ്രോസസുചെയ്യലില്‍
നിങ്ങള്‍ 80 ശതമാനം
സമയവും ചെലവഴിക്കേണ്ടിവരും.
അങ്ങനെ നിങ്ങള്‍
ചിലപ്പോള്‍ പരിശ്രമിക്കേണ്ടിവരും.
നിങ്ങള്‍ ഭാഗ്യവാനാണെങ്കില്‍,
തീര്‍ച്ചയായും, നിങ്ങള്‍ക്ക്
കൂളായി ഈ വഴിയിലൂടെ
കടന്നുപോകാം.
പിന്നെ, തീര്‍ച്ചയായും.
നിങ്ങളുടെ വിശകലനത്തിന്‍റെ
മുഖ്യഭാഗം, മോഡലിംഗ്
അല്ലെങ്കില്‍ എസ്റ്റിമേഷന്‍
അല്ലെങ്കില്‍ പര്യവേക്ഷണം
അല്ലെങ്കില്‍ മുന്‍കൂട്ടിയുള്ള
പ്രവചനം അല്ലെങ്കില്‍
പരിശോധനാതരത്തിലുള്ള
വിശകലനം കണ്ടെത്തല്‍
തുടങ്ങിയവയാണ്.
അതിന്‍റെ ഫലങ്ങള്‍
പല പ്രവര്‍ത്തനങ്ങള്‍ക്കും
പ്രായോഗികമായി ഉപയോഗിക്കാം.
നിരീക്ഷണം, നിയന്ത്രണം,
ഓപ്റ്റിമൈസേഷന്‍,
കണ്ടെത്തലുകള്‍
ഇവയെല്ലാം അതിലുള്‍പ്പെടുന്നു.
പ്രധാനമായും, ഈ എല്ലാ
ഘട്ടങ്ങളിലും, നിങ്ങള്‍
രണ്ട് കാര്യങ്ങള്‍
മനസ്സില്‍ സൂക്ഷിക്കണം.
അമ്പുകള്‍ ചൂണ്ടിക്കാട്ടുന്ന
ഒന്ന്, അവ ആവര്‍ത്തിക്കുന്നില്ല.
ചിലപ്പോഴൊക്കെ നിങ്ങള്‍ക്ക്
തിരിച്ചുപോകേണ്ടി
വരും. ഡാറ്റാ നിലവാരം
മോശമാണെന്ന് കണ്ടാല്‍,
ഞാന്‍ എന്‍റെ പരീക്ഷണത്തിലേക്കോ
അല്ലെങ്കില്‍ മെച്ചപ്പെട്ട

Kannada: 
ಕಾಲಕಾಲಕ್ಕೆ ಒಂದು
ಸಂವೇದಕದಿಂದ ನೂರು
ಅವಲೋಕನಗಳನ್ನು ನಾನು
ಸಂಗ್ರಹಿಸಿದರೆ, ಬೇರೆ
ಸಂವೇದಕವು ಬೇರೆ ರೀತಿಯಾಗಿ
ನೋಡುತ್ತದೆ; ಆದ್ದರಿಂದ,
ಮತ್ತೊಂದು ಡೇಟಾ ದಾಖಲೆಯು
ಅಸಾಧ್ಯವಾಗಬಹುದು
ಅಥವಾ ಅದೇ ಸಂವೇದಕ
ಸ್ವತಃ ರೆಕಾರ್ಡ್ ಮಾಡಿರಬಹುದು,
ಎಲ್ಲವೂ ಸ್ಥಿರವಾಗಿ
ವಿಭಿನ್ನ ಮೌಲ್ಯಗಳನ್ನು
ದಾಖಲಿಸಬಹುದು.
ಆದ್ದರಿಂದ, ಸಂಭವನೀಯ
ಮೌಲ್ಯಗಳೆಲ್ಲವನ್ನೂ
ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು
ಸಾಧ್ಯವಾಗಿಲ್ಲ, ಆದರೆ
ಸೈದ್ಧಾಂತಿಕವಾಗಿ
ಇದು ಎಲ್ಲಾ ಸಾಧ್ಯವಿರುವ
ಸ್ಥಳವನ್ನು ಊಹಿಸಲು
ಮುಖ್ಯವಾಗಿದೆ ಮತ್ತು
ನಾವು ಒಂದು ಮಾದರಿಯನ್ನು
ಪಡೆಯುವ ಜನಸಂಖ್ಯೆ
ಎಂದು ನಾವು ಕರೆಯುತ್ತೇವೆ.
ನಾನು ಇಲ್ಲಿ ಮಾದರಿಯನ್ನು
ಹೇಳಿದಾಗ ಅದು ಒಂದು
ವೀಕ್ಷಣೆಯಲ್ಲ, ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ
ಮಾದರಿ ವಿಶಿಷ್ಟವಾಗಿ
ವೀಕ್ಷಣೆ ಸಂಗ್ರಹವನ್ನು
ಉಲ್ಲೇಖಿಸುತ್ತದೆ.
ಇದು ಮೂಲಭೂತವಾಗಿ ಒಂದು
ಡೇಟಾ ರೆಕಾರ್ಡ್ ಅನ್ನು

English: 
you may have to sync the time stamps or sometimes
one variable is collected at one sampling
rate, another variable is collected at an
another sampling rate, then you may have to
determine how to pre-process.
Sometimes, in fact, lot of times data comes
with noise and we may have to remove the noise
prior to any other step that you we may take
as analysis, because noise really can hijack
the inferences that we draw. It can significantly
affect the course of data analysis. So, we
may want to filter out noise.
So, there are many, many reasons why you want
to spend time in this preliminary step which
is perhaps the most important. Some bit of
… there is a bit of drudgery involved in
it. It can really get on to your nerves, and
there is a golden 80/20 rule which says of
the 100 percent of the time that it takes
for overall data analysis, you may have to

Marathi: 
आपल्या मण्यांवर
परिणाम करू शकते
आणि एक सोनेरी 80/20
नियम आहे जो एकूण
डेटा विश्लेषणासाठी
घेतलेल्या वेळेच्या
100 टक्के लोकांबद्दल
आहे, आपल्याला डेटाची
पूर्व-प्रक्रिया
करण्यावर 80 टक्के
वेळ खर्च करावा लागू
शकतो . आपण असे कधी
कधी घालवले पाहिजे
असे प्रयत्न आपण
भाग्यवान असाल तर,
अर्थातच, आपण फक्त
या टप्प्यावर एका
हवेतून जाऊ शकता.
मग नक्कीच, आपल्या
विश्लेषणचा मुख्य
भाग म्हणजे मॉडेलिंग
किंवा अंदाज किंवा
अन्वेषणकारक आहे
किंवा पूर्वानुमानित
प्रकारचे किंवा अनिवार्य
प्रकारचे विश्लेषण
निदान होऊ शकते आणि
त्यावरील परिणाम,
ज्याचे परिणाम मॉनिटरिंग,
नियंत्रण, ऑप्टिमायझेशन
सारख्या अनेक अनुप्रयोगांमध्ये
असतात , आम्ही पूर्वी
चर्चा केली आहे म्हणून
नवकल्पना.
आता, सर्वात महत्वाचे
म्हणजे, या सर्व चरणांमध्ये,
आपण दोन गोष्टी लक्षात
ठेवल्या पाहिजेत.
बाण सूचित करतात
म्हणून ते अपरिहार्यपणे
पुनरावृत्त नाहीत.
याचा अर्थ, काहीवेळा
आपल्याला परत जावे
लागेल.
तर, मला आढळल्यास
डेटाची गुणवत्ता

Gujarati: 
છે તે એક પુરાવા તરીકે
કામ કરે છે અને હું
મારા પૂર્વધારણાને
સમર્થન આપવા માટે
ડેટામાં પુરાવાઓ
શોધી રહ્યો છું, અને

Hindi: 
अब, बहुत महत्वपूर्ण
बात यह है कि इन सभी
चरणों में आपको दो
चीजों को ध्यान में
रखना चाहिए।
तीरों के संकेत के
रूप में एक, वे जरूरी
नहीं हैं।
इसका मतलब है, कभी-कभी
आपको वापस जाना पड़
सकता है।
इसलिए, यदि मुझे लगता
है कि डेटा की गुणवत्ता
खराब है, तो मुझे अपने
प्रयोग या उस व्यक्ति
को वापस जाना पड़
सकता है जिसने मुझे
बेहतर डेटा देने
के लिए डेटा दिया
है या मुझे लगता है
कि जो सुविधाएं मैं
चाहता हूं वे डेटा
में मौजूद नहीं हैं
, मुझे प्रयोग को फिर
से शुरू करना पड़
सकता है या अनुमान
के बाद मुझे पता चला
है कि डेटा की गुणवत्ता
पर्याप्त नहीं है
या मैंने पर्याप्त
प्री-प्रोसेसिंग
नहीं की है, मुझे वापस
जाना पड़ सकता है।
यह पहला बिंदु है।
और दूसरा बिंदु यह
है कि यदि आपके पास
कोई डोमेन ज्ञान
है, और यह बहुत महत्वपूर्ण
है; जाहिर है, आपको
पता होना चाहिए कि
डेटा कहां से आ रहा
है, चाहे वह जैविक
प्रक्रिया, एक अर्थशास्त्रीय
प्रक्रिया या इंजीनियरिंग

Bengali: 
এটা মনে রাখা খুবই
গুরুত্বপূর্ণ কারণ
উভয়ই আপনার তৈরি
করা ডাটা টাইপে অবদান
রাখে।
উদাহরণস্বরূপ, আসুন
আমরা বলি, আমি কিছু
চুল্লীর তাপমাত্রা
পর্যবেক্ষণ করছি
যা শীতল প্রবাহ দ্বারা
নিয়ন্ত্রিত হচ্ছে।
এই পারমাণবিক চুল্লী
এবং তাই উপর খুব সাধারণ।
এখন, আমি দেখছি যে
চুল্লী একটি শারীরিক
প্রক্রিয়া।
তাপমাত্রা নিয়ন্ত্রণ
করার চেষ্টা করছে

Tamil: 
டேட்டா செட் (Data set)களுக்கு
இடையில் எந்த வித்தியாசத்தையும்
செய்ய முடியாது.
எனினும், நீங்கள்
பார்க்க முடியும்
என, இந்த தரவு ஒவ்வொரு
அம்சங்கள் ஒரு பரந்த
வேறுபாடு உள்ளது.
உதாரணமாக, நீங்கள்
டேட்டா செட் (Data set)
2 பார்த்தால், ஒரு
பரவலான உறவு வகையான
உள்ளது, டேட்டா செட்
(Data set) 4 அதேசமயம், அனைத்து
புள்ளிகள் ஒரு நேர்
கோட்டில் விழும்.
நடைமுறையில், x இல்
எந்த மாற்றமும் இல்லை,
y யும் ஒரு வெளிப்புறத்தில்
இருந்து மாறி மாறி
வருகிறது.
எனவே, தரவு டேட்டா
செட் (Data set) உங்கள்
டேட்டா அனாலிசிஸ்
(Data Analysis) செய்ய முடியும்
என்ன காட்ட உங்களுக்கு
மிகவும் பயனுள்ளதாக
இருக்கும்.
நிலுவையிலிருக்கும்
தரவு புள்ளிவிவரங்கள்
சாதாரண விஷயத்தில்
இருந்து விழும் அல்லது
தரவு மீதமுள்ள பகுதியிலிருந்து
வெளியேறும்.
உண்மையில், நீங்கள்
தரவு தொகுப்பு 3 பார்த்தால்,
அனைத்து டேட்டா பாயிண்ட்
(Data point)கள் ஒரு outlier வலது
என்று ஒரு டேட்டா
பாயிண்ட் (Data point) தவிர
ஒரு நேராக வரியில்
பொய். எனவே, இரண்டு
டேட்டா செட் (Data set)களை
நீங்கள் ஒரே மாதிரியான
புள்ளிவிவரங்களைப்
பார்க்கும்போது
முற்றிலும் ஒரே மாதிரியாக
இருக்க முடியும்.
ஆனால், நீங்கள் அவற்றை
சதி செய்கிறீர்கள்
என்றால், பெரிய வேறுபாடு
உள்ளது என்று உங்களுக்குத்
தெரியும்.

Malayalam: 
ഡാറ്റ എനിക്ക് നല്‍കാന്‍
ഡാറ്റ തന്ന ആ വ്യക്തിയിലേക്കോ
തിരികെ പോകണം.
അല്ലെങ്കില്‍ ഞാന്‍
ആവശ്യപ്പെടുന്ന
സവിശേഷതകള്‍ ഡാറ്റയില്‍
ഇല്ലെന്ന് ഞാന്‍
കണ്ടെത്തുന്നു.
ഞാന്‍ പരീക്ഷണം പുനര്‍നിര്‍വ്വചിക്കേണ്ടതുണ്ടോ,
അല്ലെങ്കില്‍ എനിക്ക്
മതിയായ പ്രീ-പ്രോസസിംഗ്
നടത്താന്‍ പോകേണ്ടതാണോ
എന്ന് ഞാന്‍ മനസ്സിലാക്കുന്നു.
അതാണ് ആദ്യത്തെ വസ്തുത
രണ്ടാമത്തെ കാര്യം
നിങ്ങള്‍ക്ക് ഏതെങ്കിലും
ഡൊമേയ്ന്‍ അറിവ്
ഉണ്ടെങ്കില്‍ അത്
വളരെ പ്രധാനമാണ്.
ഡാറ്റ എവിടെ നിന്നാണ്
വരുന്നതെന്ന് നിങ്ങളറിയണം.
ഒരു ജൈവ പ്രക്രിയയില്‍
നിന്നോ സാമ്പത്തിക
പ്രക്രിയയില്‍ നിന്നോ
അല്ലെങ്കില്‍ ഒരു
എഞ്ചിനീയറിംഗ് പ്രക്രിയയില്‍
നിന്നോ അല്ലെങ്കില്‍
ചില സോഷ്യല്‍ മീഡിയ
പ്രക്രിയയില്‍ നിന്നോ
ٹ. അല്ലെങ്കില്‍ ഒരു
രാസപ്രക്രിയയില്‍
നിന്നോ തുടങ്ങിയവയില്‍
നിന്നാണ് ഡാറ്റ വരുന്നതെന്ന്
നിങ്ങള്‍ക്കറിയാം.
നിങ്ങളുടെ ഡാറ്റയ്ക്കുള്ള
സാമ്പിള്‍ റേറ്റ്
എന്തായിരിക്കണം
എന്ന് പോലും തിരഞ്ഞെടുക്കുന്ന
ഘട്ടത്തില്‍, ആ അറിവ്
ഓരോ ഘട്ടത്തിലും

English: 
spend 80 percent of the time on data pre-processing.
That’s the kind of effort that you may have
to put in sometimes. If you are lucky, of
course, you can just go pass through this
step in a breeze.
Then comes, of course, the core part of your
analysis which is modeling or estimation or
exploratory or may be predictive kind or prescriptive
kind of analysis diagnosis and so on, the
results of which feed into many applications,
such as monitoring, control, optimization,
innovations as we have discussed earlier.
Now, very importantly, in all of these steps,
you should keep in mind two things. One as
the arrows indicate, they are not necessarily
iterative. That means, sometimes you may have
to go back. So, if I find that the data quality
is poor, I may have to go back to my experiment
or the person who gave me the data to give
me better data or that I find that the features
that I want are not present in the data, I
may have to redo the experiment or after estimation

Marathi: 
खराब आहे, मला माझ्या
प्रयोगाकडे परत जावे
लागेल किंवा ज्या
व्यक्तीने मला अधिक
चांगले डेटा देण्यासाठी
डेटा दिला असेल किंवा
मला असे वाटते की
माझी इच्छा असलेली
वैशिष्ट्ये डेटामध्ये
नाही , मला प्रयोग
पुन्हा करणे आवश्यक
आहे किंवा अंदाज
केल्यानंतर मला समजले
की डेटाची गुणवत्ता
चांगली नाही किंवा
मी पुरेशी पूर्व
प्रक्रिया केलेले
नाही, मला परत जावे
लागेल आणि असेच काही.
हा पहिला मुद्दा
आहे. आणि दुसरा मुद्दा
असा आहे की आपल्याकडे
कोणतेही डोमेन ज्ञान
आहे, आणि ते खूप महत्वाचे
आहे; जाहीरपणे, आपण
जिथे कुठली माहिती
आणली आहे हे माहित
असणे गरजेचे आहे,
मग ती जैविक प्रक्रियेतून
येते, अर्थमितीय
प्रक्रिया किंवा
अभियांत्रिकी प्रक्रिया
किंवा काही सोशल
मीडिया प्रक्रिया
इत्यादी ... किंवा
रासायनिक प्रक्रियेस
आणि असेच काही. आपल्या
माहितीसाठी नमूना
दर काय असावा हे निवडताना
देखील हे ज्ञान प्रत्येक

Kannada: 
ಸೂಚಿಸುತ್ತದೆ, ಆದರೆ
ಸಿಗ್ನಲ್ ಪ್ರೊಸೆಸಿಂಗ್ನಲ್ಲಿ,
ಒಂದು ಮಾದರಿಯು ತ್ವರಿತವಾಗಿ
ಒಂದು ಮೌಲ್ಯವಾಗಿರಬಹುದು
ಮತ್ತು ಇದು ನಿರ್ಣಾಯಕ
ಜಗತ್ತಿನಲ್ಲಿದೆ.
ಈ ಜನಸಂಖ್ಯೆ ಮತ್ತು
ಮಾದರಿಗೆ ಅನುಗುಣವಾಗಿ
ನಮಗೆ ಸತ್ಯ ಮತ್ತು
ಅಂದಾಜು ಇದೆ. ಜನಸಂಖ್ಯೆಯು
ಎಲ್ಲ ಸಾಧ್ಯತೆಗಳ ಸಂಗ್ರಹವಾಗಿದೆ
ಎಂದು ನಾವು ಹೇಳಿದ್ದೇವೆ,
ಆದರೆ ಇದು ಸತ್ಯದಿಂದ
ನಿರೂಪಿಸಲ್ಪಟ್ಟಿದೆ.
ಆದ್ದರಿಂದ, ಈ ಸಂಪೂರ್ಣ
ಜನಸಂಖ್ಯೆಯು, ಉದಾಹರಣೆಗೆ,
ಕೆಲವು ಸರಾಸರಿ ಹೊಂದಿದೆ.
ನಾವು ಹೇಳುವೆವು, ಒಂದು
ವಯಸ್ಸಿನ ಗುಂಪಿನ ಸರಾಸರಿ
ವೇತನವನ್ನು ನಾನು ನೋಡುತ್ತಿದ್ದೇನೆ
- ಬಹಳ ದೊಡ್ಡ ದೇಶದಲ್ಲಿ,
ನಾವು ಹೇಳುವುದಾದರೆ
ಅಥವಾ ದೊಡ್ಡ ಸಂಸ್ಥೆಯೊಂದರಲ್ಲಿ.
ಪ್ರತಿಯೊಂದನ್ನೂ ಕೇಳಲು
ಮತ್ತು ಕೇಳಲು ನನಗೆ
ಸಾಧ್ಯವಿಲ್ಲ.

Hindi: 
प्रक्रिया या कुछ
सोशल मीडिया प्रक्रिया
से आ रहा है ... या एक
रासायनिक प्रक्रिया
और इसी तरह से।
यह जानकारी आपके
डेटा के लिए नमूना
दर क्या होनी चाहिए,
यह चुनने के बावजूद
हर कदम पर भी विचार
किया जाना चाहिए
- यह है कि आपको कितनी
बार डेटा एकत्र करना
चाहिए; यही वह जगह
है जहां डोमेन ज्ञान
की आपकी यात्रा शुरू
होती है।
और अगर मुझे पता है,
उदाहरण के लिए, मैं
एक पीएच सिस्टम देख
रहा हूं, मुझे पता
है कि यह एक गैर-रैखिक
प्रणाली है।
फिर जब मॉडलिंग चरण
में, मुझे रैखिक मॉडल
बनाने के बारे में
भी नहीं सोचना चाहिए,
लेकिन अगर मुझे नहीं
पता कि डेटा कहां
से आ रहा है, तो यह
सिर्फ एक डेटा सेट
है और इसका सीमित
उपयोग है, यह सिर्फ
कुछ प्रकार का है
एक खिलौना जिसे मैं
चारों ओर खेल रहा
हूं।
इसलिए, डोमेन ज्ञान
को प्रत्येक चरण
में सर्वोत्तम संभव
तरीके से उपयोग किया
जाना चाहिए और यह
निश्चित रूप से निर्भर
करता है कि आपके पास
कितना डोमेन ज्ञान

Kannada: 
ಪ್ರಾಯೋಗಿಕ ಕಾರಣಗಳಿಗಾಗಿ,
ಅವರ ಸಂಬಳದ ಬಗ್ಗೆ
ಈ ಮಾಹಿತಿಯನ್ನು ಸಂಗ್ರಹಿಸಲು
ಕೇಳಲು ನಾನು ಕೆಲವರನ್ನು
ಮಾತ್ರ ಆಯ್ಕೆ ಮಾಡಬಹುದು
ಮತ್ತು ಇದರಿಂದ ನಾನು
ನಿಜವಾದ ಸರಾಸರಿ ವೇತನವನ್ನು
ನಿರ್ಣಯಿಸುತ್ತೇನೆ.
ಆದ್ದರಿಂದ, ನಿಜವಾದ
ಸರಾಸರಿ ಸಂಬಳವು ಸತ್ಯವಾಗಿದೆ,
ಅದು ಜನಸಂಖ್ಯೆಯನ್ನು
ನಿರೂಪಿಸುತ್ತದೆ - ವಯಸ್ಸಿನ
- ಮತ್ತು ಅಂದಾಜು ನಾನು
ಡೇಟಾದಿಂದ ಪಡೆಯುವದು.
ನಿಸ್ಸಂಶಯವಾಗಿ, ಅಂದಾಜು
ಯಾವಾಗಲೂ ಸತ್ಯದಿಂದ
ವಿಭಿನ್ನವಾಗಿರುತ್ತದೆ
ಏಕೆಂದರೆ ನಾನು ಎಲ್ಲ
ಸಾಧ್ಯತೆಗಳನ್ನು ನೋಡಲಿಲ್ಲ.
ಮತ್ತು ಅಂದಾಜು ಸಿದ್ಧಾಂತವು
ದಾಖಲೆಯ ಡೇಟಾದಿಂದ
ಸಮರ್ಥವಾದ ರೀತಿಯಲ್ಲಿ,
ಆಸಕ್ತಿಯ ನಿಯತಾಂಕವನ್ನು
ಹೇಗೆ ಅಂದಾಜು ಮಾಡುವುದೆಂದು
ಹೇಳುತ್ತದೆ.
ಇದಕ್ಕೆ ಸಂಬಂಧಿಸಿದಂತೆ,
ನಾವು ಈ ಅಂದಾಜಿನನ್ನೂ
ಹೊಂದಿದ್ದೇವೆ.
ನೀವು ಈ ಪದಗಳನ್ನು
ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ

Bengali: 
এমন একটি নিয়ামক
আছে এবং তাই।
চলুন শুরু করা যাক
এটি তাপমাত্রা নিয়ন্ত্রণ
একটি চমত্কার কাজ
করছে সুতরাং, তাপমাত্রা
তার নির্ধারিত সময়ে
অনুষ্ঠিত হয়, তবে
আমি যে সেন্সরটি
ব্যবহার করছি সেটি
বেশ শোরগোল হতে পারে।
পরিশেষে, আমার কাছে
আসে এমন তথ্য সরাসরি
প্রক্রিয়ার মধ্যবর্তী
প্রক্রিয়া থেকে
নয়, শারীরিক প্রক্রিয়া
এবং ডেটা আমার কাছে
একটি সেন্সর এবং
সেই সেন্সর বৈশিষ্ট্যগুলি।

Tamil: 
பின்னர், நிச்சயமாக,
நாம் சரியாக நடவடிக்கை
எடுக்கும் மற்றும்
தேவையான அம்சங்கள்
பிரித்தெடுக்க தேவையான
நடவடிக்கைகளை எடுக்கும்.
எனவே, அந்த வட்டம்
இது எந்த டேட்டா
அனாலிசிஸ் (Data Analysis)
முன் தரவு காட்டி
தேவை இயக்கப்படுகிறது.
பின்னர், நிச்சயமாக,
நாங்கள் ஒரு தரம்
சோதனை செய்தோம்.
எடுத்துக்காட்டுக்கு,
நாம் வெளிநாட்டவர்கள்
இருப்பதைக் கண்டோம்.
அது மிகவும் முக்கியம்.
பல முறை டேட்டா (Data)
காணாமல் போன மதிப்புகளுடன்
வருகிறது.
காணாமல் போன மதிப்புகளை
சமாளிக்க எப்படி
தீர்மானிக்க வேண்டும்.
நீங்கள் அதை மாற்றவோ
அல்லது அதனுடன் வாழவோ,
இடைக்கணிப்பு செய்யலாமா,
இல்லையா என்பதைப்
பற்றிய முழு கோட்பாடும்
உள்ளது.
எனவே வெளிப்படையாக,
அதை பற்றி பேச முடியாது.
பின்னர், பிற வகையான
முன் செயலாக்கத்தை
நீங்கள் செய்ய வேண்டியிருக்கும்.
உதாரணமாக, நீங்கள்
பல்வகைப்படுத்தப்பட்ட
செயல்களில் நேர முத்திரைகளை
ஒத்திசைக்க வேண்டும்;
நீங்கள் வெவ்வேறு
மாறிகள் இருந்து
டேட்டா (Data) சேகரிக்க
எங்கே, நீங்கள் நேர
முத்திரைகளை ஒத்திசைக்க
வேண்டும் அல்லது
சில நேரங்களில் ஒரு
மாதிரியை ஒரு மாதிரி
விகிதம் சேகரிக்க
வேண்டும், மற்றொரு
மாதிரியை மற்றொரு
மாதிரி விகிதத்தில்
சேகரிக்கப்படுகிறது,
நீங்கள் முன் செயல்முறை
எப்படி தீர்மானிக்க
வேண்டும்.
சில நேரங்களில்,
உண்மையில், பல முறை
தரவு சத்தம் வருகிறது
மற்றும் நாங்கள்
எந்த பகுதியிலும்
சத்தத்தை அகற்ற வேண்டும்,

Malayalam: 
നിര്‍ണ്ണയിക്കപ്പെടണം
- അങ്ങനെയാണ് ഡാറ്റ
ശേഖരിക്കേണ്ടത്.
അങ്ങനെയാണ് നിങ്ങളുടെ
ഡൊമെയ്ന്‍ വിജ്ഞാനം
ആരംഭിക്കുന്നത്.
എനിക്ക് അറിയാമെങ്കില്‍
ഉദാഹരണത്തിന്, ഞാന്‍
ഒരു ജഒ സിസ്റ്റത്തെ
നോക്കിക്കൊണ്ടിരിക്കുമ്പോള്‍.
അത് ഒരു നോണ്‍-ലീനിയര്‍
സിസ്റ്റമാണെന്ന്
എനിക്കറിയാം.
പിന്നെ മോഡലിംഗ്
ഘട്ടത്തില്‍, ഞാന്‍
ലീനിയര്‍ മോഡലുകളുടെ
നിര്‍മ്മാണം ചിന്തിക്കാന്‍
പാടില്ല.
എന്നാല്‍ ഡാറ്റ എവിടെനിന്ന്
വരുന്നു എന്ന് അറിയില്ലെങ്കില്‍
അത് ഒരു ഡാറ്റ സെറ്റ്
ആയി അവശേഷിക്കും.
അതിന്‍റെ ഉപയോഗം
പരിമിതമാണ്.
ഞാന്‍ കളിക്കുന്ന
ഒരു കളിപ്പാട്ടം
പോലെയാണത്.
അതിനാല്‍, ഡൊമെയ്ന്‍
വിജ്ഞാനത്തെ ഏറ്റവും
മികച്ച രീതിയില്‍
ഓരോ ഘട്ടത്തിലും
ഉപയോഗിക്കേണ്ടിയിരിക്കുന്നു.
തീര്‍ച്ചയായും നിങ്ങള്‍ക്ക്
എത്രമാത്രം ഡൊമെയ്ന്‍
അറിവ് ഉണ്ട് എന്ന
കാര്യം പൂര്‍ണ്ണമായും
ആശ്രയിച്ചിരിക്കുന്നു.
ഇത് നിങ്ങളെ ആരു
മോഡല്‍ ഘടന, അതിന്‍റെ
സവിശേഷതകളോ അല്ലെങ്കില്‍
നിങ്ങള്‍ പ്രതീക്ഷിക്കാവുന്ന
noise ലെവലോ - ഒരു സെന്‍സര്‍
noise അല്ലെങ്കില്‍

Gujarati: 
તે આંકડાકીય રીતે
યોગ્ય રીતે કરવામાં
આવે છે. અને પૂર્વધારણા
પરીક્ષણ દરેક સ્ટેટિસ્ટિક
ઇન્ફરન્સિંગ(statistical
inferencing) અભ્યાસનો એક

English: 
I figure out that the data quality is not
good enough or that I had not done sufficient
pre-processing, I may have to go back and
so on. That is the first point.
And the second point is if you have any domain
knowledge, and that’s very, very important;
obviously, you should know where the data
is coming from, whether it is coming from
a biological process, an econometric process
or an engineering process or some social media
process and so on… or a chemical process
and so on. That knowledge should be factored
in at every step even in choosing what should
be the sampling rate for your data - that
is how often you should collect the data;
that’s where your journey of domain knowledge
begins.
And if I know, for example, I am looking at
a PH system, I know it’s a non-linear system
right. Then when at the modeling stage, I

Marathi: 
टप्प्यावर आले पाहिजे
- ते किती वेळा आपण
डेटा एकत्रित करावा;
आपल्या डोमेन ज्ञानाच्या
प्रवासाला सुरुवात
होते तिथे. आणि जर
मला माहित असेल, उदाहरणार्थ,
मी पीएच यंत्र पाहत
आहे, मला माहित आहे
की हे एक अ-रेखीय प्रणाली
आहे मग जेव्हा मॉडेलिंग
टप्प्यामध्ये, मी
रेखीय मॉडेल्स बांधण्याचा
विचार करू नये, परंतु
डेटा कुठे येतो हे
मला माहिती नसल्यास,
हे फक्त एक डेटा सेटच
राहते आणि मर्यादित
वापरासाठी माझ्याकडे
आहे, हे फक्त काही
प्रकारचे आहे एक
खेळत जो मी खेळतोय.
म्हणून, डोमेन ज्ञानाचा
वापर प्रत्येक टप्प्यावर
सर्वोत्तम पद्धतीने
करावा लागेल आणि
हे पूर्णपणे आपल्यावर
किती ज्ञान आहे त्यावर
अवलंबून आहे. हे मॉडेलची
रचना, आपल्याला कोणत्या
प्रकारचे आवाहन शोधणे
गरजेचे आहे किंवा
आपण कोणत्या अपेक्षा
करणार आहात त्या
आवाजाची निवड करण्यात
मदत करू शकता - जरी
ते सेन्सर आवाज किंवा
प्रक्रिया आवाज आणि

Hindi: 
है।
यह मॉडल की संरचना,
आपको किस प्रकार
की विशेषताओं या
शोर के स्तर की अपेक्षा
कर सकता है, चुनने
में आपकी मदद कर सकता
है - चाहे वह एक सेंसर
शोर या एक प्रक्रिया
शोर है और इसी तरह,
या यहां तक ​​कि आपके
अनुप्रयोगों में
भी । तो, इसे ध्यान
में रखा जाना चाहिए।
प्रकृति में सभी
अनुवर्ती, लेकिन
इसके लिए एक निश्चित
systematizm है - अपने मॉडल
को सही तरीके से चुनें
और सुनिश्चित करें
कि आप डेटा गुणवत्ता
जांच के माध्यम से
जाएं; डेटा को कल्पना
करें; पूर्व प्रक्रिया;
फिर मॉडल का निर्माण
कर रहे हैं, तो अपने
मॉडल ठीक से चुनें।
हम इसके बारे में
मॉडलिंग कौशल पर
अगले व्याख्यान में
या सही तरीके से अनुमान
लगाने के बारे में
बात करेंगे।
तो, अब हम इस पर थोड़ा
और विस्तार करेंगे।
इसलिए, हम डेटा विश्लेषण
(DATA ANALYSIS)पर जाने से
पहले, जैसा कि हमने
सीखा, पहला कदम कुछ
प्रारंभिक प्रश्न
पूछना है।
किस प्रकार के विश्लेषण
की आवश्यकता है?
चाहे यह वर्णनात्मक,
पूर्वानुमानित और

Malayalam: 
ഒരു പ്രോസസിംഗ് noise
ആകട്ടെ, അല്ലെങ്കില്‍
നിങ്ങളുടെ ആപ്ലിക്കേഷനുകളിലും
തെരഞ്ഞെടുക്കാന്‍
സഹായിക്കുന്നു.
അതിനാല്‍, അത് മനസ്സില്‍
സൂക്ഷിക്കണം.
എല്ലാ പ്രവൃത്തിയും,
ആവര്‍ത്തനസ്വഭാമുള്ളതാണ്.
പക്ഷേ അതില്‍ ഒരു
നിശ്ചിത സിസ്റ്റം
ഉണ്ട് - നിങ്ങളുടെ
മോഡലുകള്‍ ശരിയായി
തിരഞ്ഞെടുക്കുകയും
ഡാറ്റ നിലവാര പരിശോധനയിലൂടെ
കടന്നുപോകുന്നത്
ഉറപ്പാക്കുക.
ഡാറ്റ വീക്ഷണം നടത്തുക.
പ്രീ-പ്രോസസ്സ്,
നിങ്ങള്‍ മോഡലുകളുടെ
നിര്‍മ്മാണവും മറ്റും
നിര്‍മ്മിക്കുകയാണെങ്കില്‍,
നിങ്ങളുടെ മോഡലുകള്‍
ശരിയായി തിരഞ്ഞെടുക്കുക.
അതിനെക്കുറിച്ച്
നമ്മള്‍ അടുത്ത ലെക്ടറില്‍
സംസാരിക്കും.
അപ്പോള്‍, ഇപ്പോള്‍
നമ്മള്‍ ഈ ഒരു ബിറ്റ്
വികസിപ്പിക്കാം.
അതിനാല്‍, നമ്മള്‍
ഡാറ്റ വിശകലനത്തിലേക്ക്
മുന്നോട്ടുപോകുന്നതിന്
മുമ്പ്, ആദ്യം പഠിച്ച
കാര്യങ്ങള്‍, ചില
പ്രാഥമിക ചോദ്യങ്ങള്‍
ചോദിക്കേണ്ടതാണ്.
ഏത് തരം വിശകലനം
ആവശ്യമാണ്?
വിശകലനം വിവരണാത്മകവും
പ്രവചനാത്മകവും
ആകാം.
അത് വിശകലനം മുഴുവനും
മാറ്റുന്നു.
ഡാറ്റ എവിടെ നിന്ന്
വരുന്നു?
ഡാറ്റയുടെ ഉറവിടങ്ങള്‍
- ഞങ്ങള്‍ ഇപ്പോള്‍

Tamil: 
நீங்கள் பகுப்பாய்வை
எடுத்துக்கொள்ளலாம்,
ஏனென்றால் இரைச்சல்
உண்மையிலேயே நாம்
வரையறுக்கப்படும்
தொடுப்புகளை கடத்தலாம்.
இது தரவு பகுப்பாய்வு
போக்கை கணிசமாக பாதிக்கும்.
எனவே, நாம் சத்தம்
வடிகட்ட வேண்டும்.
ஆகையால், இந்த ஆரம்ப
படிப்பில் நேரத்தை
செலவழிக்க ஏன் பல
காரணங்கள் உள்ளன,
இது மிக முக்கியமானது.
சில பிட்(bit) அதில்
சண்டை போடுவது ஒரு
பிட்(bit) உள்ளது.
இது உண்மையில் உங்கள்
நரம்புகள் பெற முடியும்,
மற்றும் ஒட்டுமொத்த
டேட்டா அனாலிசிஸ்
(Data Analysis) எடுக்கும்
நேரம் 100 சதவீதம்
பற்றி கூறுகிறது
ஒரு தங்க 80/20 ஆட்சி
உள்ளது, நீங்கள்
டேட்டா (Data)முன் செயலாக்க
நேரத்தில் 80 சதவீதம்
செலவிட வேண்டும்
. நீங்கள் சில நேரங்களில்
வைக்க வேண்டும் என்று
வகையான முயற்சி தான்.
நீங்கள் அதிர்ஷ்டம்
என்றால், நிச்சயமாக,
நீங்கள் ஒரு காற்று
இந்த நடவடிக்கை மூலம்
செல்ல முடியும்.
பின்னர், உங்கள்
அனாலிசிஸ் (Analysis)களின்
முக்கிய பகுதியாக
மாதிரியாக்கம் அல்லது
மதிப்பீடு அல்லது
ஆராய்ச்சிக்கான
அல்லது முன்னறிவிக்கப்பட்ட
வகை அல்லது பகுப்பாய்வு
வகை பகுப்பாய்வு
கண்டறிதல் போன்றது,
பல பயன்பாடுகளில்,
கண்காணிப்பு, கட்டுப்பாடு,
தேர்வுமுறை நாம்
முன்னர் விவாதித்தபடி
புதுமையானவை.
இப்போது, ​​மிக முக்கியமாக,
இந்த அனைத்து படிகளிலும்,
நீங்கள் இரண்டு விஷயங்களை
மனதில் வைத்துக்கொள்ள
வேண்டும்.
அம்புகள் ஒன்று என
சுட்டிக்காட்டுகின்றன,

Marathi: 
इत्यादी, किंवा आपल्या
अनुप्रयोगातही . तर,
हे लक्षात ठेवले
पाहिजे.
सर्व-मध्ये-सर्व
पुनरावृत्ती निसर्गात,
परंतु त्यात एक विशिष्ट
पद्धत आहे - आपल्या
मॉडेल्सची निवड योग्यपणे
करा आणि डेटा गुणवत्तेची
तपासणी करा. डेटाची
कल्पना करा; पूर्व-प्रक्रिया;
नंतर आपले मॉडेल
योग्यरित्या निवडा,
आपण मॉडेल बांधत
असाल आणि इत्यादी.
आम्ही याबद्दल बोलू
या की पुढच्या भाषणात
मॉडेलिंगचे कौशल्य
किंवा अंदाज योग्यरित्या
आणि इतर गोष्टींवर.
तर आता आपण याबद्दल
थोडी अधिक माहिती
मिळवू.
म्हणून, आपण डेटा
विश्लेषणात जाण्यापूर्वी,
पहिली पायरी, जसे
आम्ही शिकलो, काही
प्राथमिक प्रश्नांची
विचारणे आहे.
कोणत्या प्रकारचे
विश्लेषण आवश्यक
आहे?
हे वर्णनात्मक, पूर्वानुमानी
आणि असंवेदनशील असले
तरीही, संपूर्ण विश्लेषणातील
बदल डेटा कुठून येतो?
डेटाचे स्त्रोत - आम्ही
आत्ताच विचारले आहे
की आमच्याकडे वेळ
डोमेन, डेटा वारंवारता
डोमेन, डेटा जैविक
प्रक्रिया डेटा आणि
अशी बर्याच गोष्टी
आहेत. डेटा कसा प्राप्त
झाला?

Kannada: 
ಮತ್ತು ಅಂದಾಜುಗಾರ
ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.
ಒಂದು ಅಂಕಿ ಅಂಶವು
ನಿಮ್ಮ ಅವಲೋಕನಗಳ ಗಣಿತ
ಕಾರ್ಯವನ್ನು ಮಾತ್ರವಲ್ಲ.
ಮತ್ತೆ, ಮಾದರಿ ಸರಾಸರಿ
ಒಂದು ಅಂಕಿ ಆಗಿದೆ;
ಮಾದರಿ ವ್ಯತ್ಯಾಸವು
ಅಂಕಿ ಅಂಶವಾಗಿದೆ.
ಇದು ಕೇವಲ ನೀವು ಗಣನೆಗೆ
ತೆಗೆದುಕೊಳ್ಳುತ್ತಿರುವ
ಗಣಿತದ ಕಾರ್ಯಾಚರಣೆ.
ಒಂದು ಅಂದಾಜುಕಾರ ಕೂಡ
ಗಣಿತದ ಕಾರ್ಯವಾಗಿದೆ.
ಗಣಿತದ ರೀತಿಯಲ್ಲಿ
ದತ್ತಾಂಶವನ್ನು ನಿರ್ವಹಿಸುವ
ಮೃದುವಾದ ಸಾಧನ ಅಥವಾ
ವರ್ಚುವಲ್ ಸಾಧನವೆಂದು
ನೀವು ಹೇಳಬಹುದು ಮತ್ತು
ನಿಮಗೆ ಬೇಕಾದುದನ್ನು
ನೀವು ಅಂದಾಜು ಮಾಡಬಹುದು.
ಅಂಕಿ ಅಂಶ ಮತ್ತು ಅಂದಾಜುದಾರರ
ನಡುವಿನ ವ್ಯತ್ಯಾಸವು
ತೀರಾ ಸೂಟ್ ಆಗಿದೆ.
ಮೊದಲನೆಯದಾಗಿ ಅವರು
ಒಂದೇ ರೀತಿ ಕಾಣುತ್ತಾರೆ,

Bengali: 
যে সেন্সর বৈশিষ্ট্য
আসলে তথ্য মধ্যে
যায়।
যদি সেন্সর খুব আওয়াজ
হয়, আপনি একটি শোরগোল
তথ্য দিয়ে শেষ করতে
যাচ্ছি যদি সেন্সর
পক্ষপাতদুষ্ট হয়,
আপনার ডেটা একটি
পক্ষপাত দেখাবে এখন,
তথ্য উত্পাদন প্রক্রিয়া
উভয় চুল্লী এবং
সেন্সর গঠিত।
DGP- আমরা একটি সংক্ষেপ
যে আপনি সাহিত্যে
এমনকি পাবেন হিসাবে
ব্যবহার করা হবে
- ডিটেক্টিভ হতে নির্ধারিত,
যদি আপনি একটি গাণিতিক

Gujarati: 
અભિન્ન અંગ છે. તેમાં
અલબત્ત સંભાવના સિદ્ધાંત,
અંદાજ સિદ્ધાંત અને
એવું સમાવેશ થાય

English: 
should not even think of building linear models,
but if I don’t know where the data is coming
from, it just remains a data set and its of
limited use to me, its just some kind of a
toy that I am playing around with. So, the
domain knowledge has to be used at every stage
in the best possible way and that completely
depends, of course, on how much domain knowledge
you have. It may help you in choosing the
structure of the model, the kind of features
that you should search for or the level of
noise that you can expect - whether it is
a sensor noise or a process noise and so on,
or even in your applications. So, that should
be kept in mind. All-in-all iterative in nature,
but there is a certain systematizm to it - choose
your models properly and make sure that you
go through the data quality check; visualize
the data; pre-process; then choose your models
properly, if you are building models and so
on. We will talk about that in the next lecture
on modeling skills or estimate properly and

Kannada: 
ಆದರೆ ವ್ಯತ್ಯಾಸವೆಂದರೆ,
ಅಂಕಿ-ಅಂಶವು ಕೇವಲ
ಯಾವುದೇ ಉದ್ದೇಶಕ್ಕಾಗಿ
ಅಗತ್ಯವಾಗಿ ರೂಪಿಸದ
ಗಣಿತದ ಕಾರ್ಯವಾಗಿದೆ;
ಆದರೆ, ಒಂದು ಅಂದಾಜು
ಗಣಿತದ ಕಾರ್ಯವಾಗಿದೆ
ಅದು ಮನಸ್ಸಿನಲ್ಲಿ
ಸರಿ ಎಂದು ಅಂದಾಜಿಸುವ
ಒಂದು ನಿರ್ದಿಷ್ಟ ಉದ್ದೇಶದಿಂದ
ನಡೆಸಲ್ಪಡುತ್ತದೆ.
ಆದ್ದರಿಂದ, ನೀವು ಅಂದಾಜು
ಸಿದ್ಧಾಂತದಲ್ಲಿ ಮತ್ತಷ್ಟು
ಕೆಳಗೆ ಹೋದರೆ, ಅಂಕಿ-ಅಂಶ
ಮತ್ತು ಅಂದಾಜುದಾರರ
ನಡುವಿನ ವ್ಯತ್ಯಾಸವನ್ನು
ನೀವು ಹೆಚ್ಚು ಚರ್ಚೆಯನ್ನು
ನೋಡುತ್ತೀರಿ, ಆದರೆ
ಗಣಿತದ ಕಾರ್ಯಾಚರಣೆಯಂತೆ,
ಎರಡೂ ಅಕ್ಷಾಂಶದ ಗಣಿತದ
ಕಾರ್ಯಗಳಾಗಿವೆ.
ಆದ್ದರಿಂದ, ಅಂದಾಜು
ಸಿದ್ಧಾಂತದಲ್ಲಿ, ಅಂಕಿಅಂಶಗಳು
ಮತ್ತು ಅಂದಾಜುಗಳನ್ನು
ನಾವು ಆಗಾಗ್ಗೆ ಬಳಸುತ್ತೇವೆ.
ಆದ್ದರಿಂದ, ಸ್ಯಾಂಪಲ್
ಮೀಡಿಯೆಂದರೆ ಅಂಕಿ
ಅಂಶ ಮತ್ತು ನಿಜವಾದ
ಅರ್ಥದ ಅಂದಾಜುಗಾರ,

Bengali: 
ফাংশন যে সঠিকভাবে
ডেটা ব্যাখ্যা করতে
পারেন খুঁজে পেতে
পারেন; যে, এটি তথ্য
পূর্বাভাস দিতে পারেন,
আপনি পুরোপুরি মাপসই
করতে পারেন, প্রতিটি
তথ্য বিন্দু এই গাণিতিক
ফাংশন বক্ররেখা মিথ্যা।
যে এটি তাকান এক উপায়
বা আপনি বলতে পারেন
যে আপনি ঠিক তথ্য
উৎপাদিত প্রক্রিয়া
বুঝতে পেরেছেন; সেখানে
এমন কিছু নেই যা আপনি

Hindi: 
इसी तरह है, क्योंकि
यह विश्लेषण के पूरे
पाठ्यक्रम को बदलता
है।
डेटा कहां से आता
है?
डेटा के स्रोत - हमने
अभी पूछा है, हमारे
पास समय डोमेन, डेटा
आवृत्ति डोमेन, डेटा
जैविक प्रक्रिया
डेटा आदि है।
डेटा कैसे प्राप्त
किया गया था?
किस प्रकार का हार्डवेयर
इस्तेमाल किया गया
था?
क्या यह एक इंसान
था जिसने डेटा एकत्र
किया?
क्या यह एक सेंसर
था?
अगर यह एक सेंसर था,
तो नमूना दर क्या
थी?
हमारे लिए यह जानने
में सक्षम होने के
लिए कई सवाल जान सकते
हैं कि मैं कितनी
अच्छी तरह से विश्लेषण
कर सकता हूं, और मुझे
किस प्रकार के विश्लेषण
उपकरण का उपयोग करना
चाहिए, और मुझे क्या
खोजना चाहिए।
और फिर, ज़ाहिर है,
डेटा कितना जानकारीपूर्ण
है - यह थोड़ा गुणात्मक
है, लेकिन जानकारी
के कुछ मात्रात्मक
उपायों भी हैं।
हम इसके बारे में
बात नहीं करेंगे,
लेकिन जैसा कि मैंने
कहा था, यह मूल रूप
से गुणवत्ता जांच
से संबंधित है कि
डेटा बहिष्कार गायब
हैं या नहीं।
और आखिरकार, लेकिन
शायद सबसे महत्वपूर्ण
- डाटा जनरेटिंग प्रक्रिया
पर क्या धारणाएं

Marathi: 
कोणत्या प्रकारचे
हार्डवेअर वापरले
गेले?
तो डेटा गोळा कोण
एक मानवी होते?
तो एक सेन्सर होता?
जर तो सेंसर असेल
तर, नमूना दर काय होता?
मला किती विश्लेषणाची
अपेक्षा आहे हे सांगण्यासाठी
सक्षम होण्यासाठी
बरेच प्रश्न विचारण्यात
आले आहेत, आणि मला
कोणत्या प्रकारचे
विश्लेषण साधने वापरायला
हव्या, आणि मी कशासाठी
शोधले पाहिजे.
आणि मग, अर्थातच, डेटा
किती माहितीपूर्ण
असतो - तो थोडा गुणात्मक
आहे, परंतु माहितीचे
काही परिमाणवाचक
उपायही आहेत. आम्ही
त्याबद्दल बोलणार
नाही, परंतु मी म्हटल्याप्रमाणे,
हे मुळात गुणवत्ता
तपासण्याशी संबंधित
आहे की डेटा गहाळ
आहे आणि इतकेच नाही
आणि अखेरीस, परंतु
कदाचित सर्वात महत्वाचे
- डेटा निर्मिती प्रक्रियेवर
कोणत्या गृहितकांची
निर्मिती केली जात
आहे हे स्पष्ट असले
पाहिजे.
आपण चुकीचे असू शकता.
सुरुवातीस, आपण चुकीच्या
धारणा करू शकतो, आपण
ठरवावे की एक नियतिवाचक
ठरण्यासाठी एक स्टेचॅस्टिक
प्रक्रिया, आम्ही

Tamil: 
அவை அவசியமற்றவை
அல்ல. அதாவது, சில
நேரங்களில் நீங்கள்
திரும்பி செல்ல வேண்டியிருக்கும்.
எனவே, டேட்டா (Data) தரம்
குறைவாக இருப்பதை
நான் கண்டால், என்
பரிசோதனைக்கு அல்லது
என் தரவை எனக்கு
வழங்கிய நபருக்கு
நான் தரும் தகவல்களை
தரவில்லை என்றால்,
நான் விரும்பும்
அம்சங்கள் டேட்டா
(Data)வில் இல்லை, நான்
பரிசோதனையை மறுபரிசீலனை
செய்ய வேண்டும் அல்லது
மதிப்பீட்டுக்குப்
பிறகு தரவு தரமானது
போதுமானதல்ல அல்லது
நான் முன் செயலாக்கத்தை
போதுமானதாக செய்யவில்லை
என்பதையும் நான்
கண்டுபிடித்துவிட்டேன்,
நான் மீண்டும் செல்ல
வேண்டியிருக்கும்.
இது முதல் புள்ளி.
நீங்கள் எந்த கள
அறிவும் இருந்தால்
இரண்டாவதாக உள்ளது,
அது மிகவும் முக்கியம்;
வெளிப்படையாக, ஒரு
பயோலொஜிக்கல் செயல்முறை
(biological procedure), ஒரு எகனாமிக்
செயல்முறை (economic procedure)
அல்லது ஒரு இன்ஜினியரிங்
செயல்முறை (engineering procedure)
அல்லது சில சோசியல்
மீடியா செயல்முறை
(social media procedure) மற்றும்
பலவற்றில் இருந்து
வருகிறதா, அல்லது
ஒரு கெமிக்கல் செயல்முறை
(chemical procedure)யிலிருந்து
வரும் தகவல்கள் எங்கிருந்து
வருகிறது என்பதை
நீங்கள் தெரிந்து
கொள்ள வேண்டும்.
உங்கள் டேட்டா (Data)வின்
மாதிரி விகிதமாக
இருக்க வேண்டும்
என்பதைத் தேர்ந்தெடுப்பதில்
ஒவ்வொரு படிநிலையிலும்
அறிவு அறிவுறுத்தப்பட
வேண்டும் - அதாவது
டேட்டா (Data) சேகரிக்க
எவ்வளவு நேரம் ஆகும்;
இது டொமைன் (domain) அறிவு

Malayalam: 
ആവശ്യപ്പെട്ടു.
ഞങ്ങള്‍ക്ക് സമയ
ഡൊമെയ്ന്‍, ഡാറ്റ
ആവൃത്തി ഡൊമെയ്ന്‍,
ഡാറ്റ ബയോളജിക്കല്‍
പ്രോസസ്സ് തുടങ്ങിയവ
ഉണ്ട്.
ഡാറ്റ എങ്ങനെയാണ്
നേടിയത്?
എങ്ങനെയുള്ള ഹാര്‍ഡ്
വെയര്‍ ഉപയോഗിച്ചു?
ഡാറ്റ ശേഖരിച്ചത്
ആരാണ?
അത് ഒരു സെന്‍സറാണോ?
ഒരു സെന്‍സര്‍ ആണെങ്കില്‍,
സാംപ്ലിംഗ് നിരക്ക്
എന്തായിരുന്നു?
ഞാന്‍ പ്രതീക്ഷിക്കുന്ന
വിശകലന നിലവാരങ്ങളും,
ഞാന്‍ ഉപയോഗിക്കേണ്ട
ആവിഷ്കരണ ഉപാധികള്‍
എന്തൊക്കെയായിരിക്കണമെന്നും
പല ചോദ്യങ്ങള്‍ക്കും
ഉത്തരം അറിയാന്‍
കഴിയും.
ഞാന്‍ എന്തിന് അന്വേഷിക്കണം?
പിന്നെ, തീര്‍ച്ചയായും,
ഡാറ്റ എത്രമാത്രം
അറിവ് നല്‍കുന്നു
- അത് ഒരു ബിറ്റ് ഗുണപരമായതാണ്.
എന്നാല്‍ വിവരങ്ങളുടെ
ചില ഗുണപരമായ അളവുകളുണ്ട്.
ഞങ്ങള്‍ അതിനെക്കുറിച്ച്
സംസാരിക്കില്ല.
പക്ഷേ ഞാന്‍ പറഞ്ഞത്
പോലെ, അടിസ്ഥാനപരമായി
ഡാറ്റ നഷ്ടപരിഹാരം
ഇല്ലാതായിട്ടുണ്ടോ
ഇല്ലയോ എന്നത് ഗുണനിലവാരം
പരിശോധിക്കുന്നു.
അവസാനമായി, ഒരു പക്ഷേ
ഏറ്റവും പ്രധാനപ്പെട്ടവ
- ഡാറ്റ ഉണ്ടാക്കുന്ന
പ്രക്രിയയില്‍ എന്ത്

Gujarati: 
છે. અમે પૂર્વધારણા
પરીક્ષણ ના ઊંડાણમાં
નથી જવાના.
એક એમઓઓસી (MOOC)અભ્યાસક્રમ
છે કે જે આપણે પૂર્વધારણા

English: 
so on.
So, we will now expand on this a bit more.
So, before we proceed to data analysis, the
first step, as we learned, is to ask certain
preliminary questions.
What type of analysis is required? Whether
it is descriptive, predictive and so on, because
that changes entire course of analysis. Where
does the data come from? Sources of data - we
have just asked, we have time domain, data
frequency domain, data biological process
data and so on. How was the data acquired?
What kind of hardware was used? Was it a human
who collected the data? Was it a sensor? If
it was a sensor, what was the sampling rate?
So many questions may have to be known for
us to be able to say how good a quality of
analysis that I can expect, and what should
be the kind of analysis tools that I should
be using, and what should I be searching for.
And then, of course, how informative is the
data – that’s a bit qualitative, but there
are also certain quantitative measures of

Bengali: 
ব্যাখ্যা করতে পারেন
না বা আপনি বলতে পারেন
যে পরিদর্শন মূল্যের
কোন অনিশ্চয়তা নেই।
আপনি হতে পারে ... অনেক
কি ঘটেছে আপনি শারীরিক
প্রক্রিয়া খুব ভাল
জ্ঞান থাকতে পারে।
উদাহরণস্বরূপ, আমরা
পূর্বে যে আলোচনা
করেছি তার মধ্যে
চুল্লি, গতিবিজ্ঞান,
গতিবিদ্যা, চুল্লি
সবকিছু, উষ্ণায়ণবিদ্যা
ইত্যাদি ইত্যাদি
সম্পর্কেও আমি বুঝতে
পারি, কিন্তু সেন্সরের
বৈশিষ্ট্যগুলি সম্পর্কে
আমার কাছে দরিদ্র
জ্ঞান থাকতে পারে।

Tamil: 
உங்கள் பயணம் தொடங்குகிறது
எங்கே.
உதாரணமாக, நான் ஒரு
பிஹ (pH) அமைப்பைப்
பார்த்தால் எனக்குத்
தெரியும், அது ஒரு
நேர்கோட்டு முறையல்ல
என்பதை நான் அறிவேன்.
பிறகு மாடலிங் (modelling)
கட்டத்தில், நான்
நேர்கோட்டு மாதிரிகள்
உருவாக்க விரும்பவில்லை,
ஆனால் தரவு எங்கிருந்து
வருகிறது என்று எனக்குத்
தெரியவில்லை என்றால்,
அது ஒரு டேட்டா காலெக்ஷன்ஸ்
(Data collections) மற்றும் அதன்
வரையறுக்கப்பட்ட
பயன்பாடும் எனக்கு
இருக்கிறது, அதன்
சில வகையான நான்
விளையாடிக் கொண்டிருக்கிறேன்
என்று ஒரு பொம்மை.
எனவே, டொமைன் (domain)
அறிவு சிறந்த முறையில்
ஒவ்வொரு கட்டத்திலும்
பயன்படுத்தப்பட
வேண்டும், மற்றும்
நீங்கள் எவ்வளவு
டொமைன் (domain) அறிவைப்
பெற்றிருக்கிறீர்கள்
என்பதை முற்றிலும்
சார்ந்துள்ளது.
இது மாதிரியின் கட்டமைப்பைத்
தேர்ந்தெடுப்பதில்
உங்களுக்கு உதவலாம்,
நீங்கள் தேடும் சோதனைகள்
அல்லது நீங்கள் எதிர்பார்க்கக்கூடிய
சத்தத்தின் அளவு
- இது ஒரு சென்சார்
(sensor) சத்தம் அல்லது
ஒரு செயல்முறை சத்தம்
மற்றும் பல, அல்லது
உங்கள் பயன்பாடுகளில்
இருந்தாலும் . எனவே,
அது மனதில் வைக்கப்பட
வேண்டும்.
இயற்கையில் உள்ள
அனைத்து-அனைத்தும்-அனைத்து,
ஆனால் அது ஒரு குறிப்பிட்ட
அமைப்பு உள்ளது - உங்கள்
மாதிரிகள் ஒழுங்காக
தேர்வு மற்றும் நீங்கள்
டேட்டா (Data) தர சோதனை
மூலம் செல்ல உறுதி;
டேட்டா (Data)வைப் பார்;
முன் செய்முறை கொண்டதாகும்;
நீங்கள் மாதிரி மாதிரிகள்
மற்றும் பல இருந்தால்,

English: 
information. We will not talk about it, but
as I said, it basically pertains to quality
check whether there are missing data outliers
and so on.
And lastly, but perhaps the most important
- what assumptions are being made on the data
generating process should be clear. You may
be wrong. In the beginning, we may make wrong
assumptions, we may assume a stochastic process
to be deterministic, we may assume a non-linear
process to be linear, a steady state process
to be dynamic and so on; it’s possible.
But we should stick to the assumptions that
we have made throughout the data analysis,
and choose and be the consistent and commensurate
- that is we should choose right tools and
so on, so that if you have made a mistake,
in the end, we do know that we have made a
mistake. And then, we go back, and make corrections.
And I am not going to really go into this
detail. We have already talked about it. So,
once you are through the preliminary questions,

Gujarati: 
પરીક્ષણના પરિચય
પર છે તે શીખીશુ.
તે કદાચ માર્ચના
બીજા કે ત્રીજા સપ્તાહમાં

Malayalam: 
അനുമാനങ്ങള്‍ സൃഷ്ടിക്കപ്പെടുന്നുവെന്നത്
വ്യക്തമായിരിക്കണം.
നിനക്ക് തെറ്റ് പറ്റും.
തുടക്കത്തില്‍, ഞങ്ങള്‍
തെറ്റായ അനുമാനങ്ങള്‍
ഉണ്ടാക്കാം.
നിങ്ങള്‍ stochastic പ്രക്രിയയെ
deterministic ആയി കണക്കാക്കും.
നോണ്‍ലീനിയര്‍ പ്രക്രിയ
ലീനിയറായി കണക്കാക്കും.
സുസ്ഥിരമായ പ്രക്രിയയെ
ചലനാത്മകമായി കണക്കാക്കും.
ഇത് സംഭവിക്കാം.
എന്നാല്‍, നമ്മള്‍
ഡാറ്റ വിശകലനത്തിലുടനീളം
ഉണ്ടാക്കിയ അനുമാനങ്ങളില്‍
ഒത്തുചേരുകയും, സ്ഥിരതയാര്‍ന്നതും
അനുയോജ്യവുമായവ
തിരഞ്ഞെടുക്കുകയും
വേണം - അതായത് ശരിയായ
ഉപകരണങ്ങള്‍ തെരഞ്ഞെടുക്കണം.
അതില്‍ നിങ്ങള്‍
തെറ്റ് പറ്റിയാല്‍,
അവസാനം വരെ നിങ്ങള്‍ക്ക്
തെറ്റ് പറ്റുമെന്ന്
അറിയുക.
പിന്നെ, നിങ്ങള്‍
തിരിച്ചുപോയി തിരുത്തലുകള്‍
വരുത്തണം.
ഞാന്‍ അത് വിശദമായി
പറയാന്‍ പോകുന്നില്ല.
ഞങ്ങള്‍ ഇതിനകം അതിനെക്കുറിച്ച്
സംസാരിച്ചിട്ടുണ്ട്.
അതിനാല്‍, നിങ്ങള്‍
പ്രാഥമികചോദ്യത്തിലൂടെ
കടന്നുപോയാല്‍ നമ്മള്‍
ഡാറ്റ തയ്യാറാക്കും.
അനേകം ഡാറ്റാ പ്രീ-പ്രോസസ്സിംഗ്
ഘട്ടങ്ങള്‍ അതിനുപയോഗിക്കും.
ഡേറ്റാക്കു എന്ത്
പ്രശ്നങ്ങള്‍ ഉണ്ടെന്നതിനെ
അത് ആശ്രയിച്ചിരിക്കുന്നു.

Kannada: 
ಏಕೆಂದರೆ ನಿಜವಾದ ಅರ್ಥವನ್ನು
ಅಂದಾಜು ಮಾಡಲು ಮಾದರಿ
ಅರ್ಥವನ್ನು ರೂಪಿಸಲಾಗಿದೆ
ಮತ್ತು ಮತ್ತೆ ಸಂಬಂಧಿಸಿದೆ;
ನೀವು ಜನಸಂಖ್ಯೆ ಮತ್ತು
ಮಾದರಿಯ ಬಗ್ಗೆ ಎಲ್ಲವನ್ನೂ
ನೋಡಬಹುದು; ನೀವು ಸಮಗ್ರ
ಮತ್ತು ಮಾದರಿ ಸರಾಸರಿ
ಹೊಂದಿರುತ್ತವೆ.
ನೀವು ನೋಡಿದ ಸಾಧ್ಯವಿರುವ
ಎಲ್ಲಾ ಮೌಲ್ಯಗಳಿಂದ
ನೀವು ಲೆಕ್ಕ ಹಾಕುವ
ಸರಾಸರಿ ಮೊತ್ತವು ಸಮಗ್ರ
ಸರಾಸರಿ, ಇದು ನಾವು
ನೋಡಲೇ ಇಲ್ಲ; ಸಂಭಾವ್ಯ
ಮಾಹಿತಿ ದಾಖಲೆಗಳು
ಅಥವಾ ಸಂಬಳದ ಉದಾಹರಣೆಯಲ್ಲಿ
ನಾವು ಯಾವತ್ತೂ ಸಂಗ್ರಹಿಸಲು
ಯಾವತ್ತೂ ಸಾಧ್ಯವಾಗದ
ಸಂದರ್ಭಗಳಲ್ಲಿ, ಸಂಭಾವ್ಯ
ಸಮಯದ ಎಲ್ಲ ಸಂಭಾವ್ಯ
ಜನರಿಂದ ದತ್ತಾಂಶವನ್ನು
ಸಂಗ್ರಹಿಸುವ ಸಾಧ್ಯತೆ
ಇರಬಹುದು, ಮಾದರಿ ಸರಾಸರಿ,
ಸಹಜವಾಗಿ, ಸರಾಸರಿ
ಲೆಕ್ಕಾಚಾರ ಇದೆ ಈ
ಮಾದರಿಗಳಿಂದ.

Hindi: 
की जा रही हैं स्पष्ट
होनी चाहिए।
आप गलत हो सकते हैं
शुरुआत में, हम गलत
धारणाएं कर सकते
हैं, हम निर्धारित
करने के लिए एक स्टोकास्टिक
प्रक्रिया मान सकते
हैं, हम एक गैर-रैखिक
प्रक्रिया को रैखिक
मान सकते हैं, एक स्थिर
राज्य प्रक्रिया
गतिशील होने के लिए
और इसी तरह; यह संभव
है।
लेकिन हमें उन धारणाओं
से चिपकना चाहिए
जो हमने पूरे डेटा
विश्लेषण (DATA ANALYSIS)में
किए हैं, और चुनिंदा
और अनुरूप हैं - हमें
सही उपकरण चुनना
चाहिए और इसलिए, यदि
आपने गलती की है, तो
अंत में, हम पता है
कि हमने गलती की है।
और फिर, हम वापस जाते
हैं, और सुधार करते
हैं।
और मैं वास्तव में
इस विस्तार में नहीं
जा रहा हूं।
हमने इसके बारे में
पहले ही बात की है।
इसलिए, एक बार जब आप
प्रारंभिक प्रश्नों
के माध्यम से होते
हैं, तो हम कई डेटा
प्री-प्रोसेसिंग
चरणों के माध्यम
से अपना डेटा तैयार
करते हैं; इस बात पर
निर्भर करता है कि
डेटा की किस तरह की
समस्याएं हैं।
उदाहरण के लिए, यदि
डेटा बहिर्वाह है,

Marathi: 
एक नॉन-रैखिक प्रक्रिया
गृहीत धरू शकतो, एक
स्थिर, एक गतिशील
स्थितीची स्थिर स्थिती;
हे शक्य आहे. परंतु
आपण संपूर्ण डेटा
विश्लेषणात केलेल्या
गृहीतेला चिकटून
राहावे आणि निवडून
सुसंगत आणि अनुपालन
केले पाहिजे - आपण
योग्य साधनांचा आणि
इतका पर्याय निवडला
पाहिजे, म्हणजे आपण
चूक केली असेल तर
अखेरीस, आम्ही आम्ही
चूक केली आहे की माहित
नाही आणि मग आम्ही
मागे व सुधारतो.
आणि मी खरोखर या तपशीलात
जात नाहीये.
आम्ही आधीच याबद्दल
बोललो आहे. म्हणून,
एकदा आपण प्राथमिक
प्रश्नांमधून जात
असता, आम्ही अनेक
डेटा पूर्व-प्रक्रिया
चरणांद्वारे, डेटा
तयार करतो; डेटा कोणत्या
प्रकारची समस्या
आहे यावर अवलंबून
असते.
उदाहरणार्थ, डेटा
आऊट लायर (outlier) असल्यास,
माझे म्हणणे आहे,
मला साफ करणे आवश्यक
आहे, पण मजबूत पद्धतीही
आहेत. आम्ही असे म्हणतो
की आऊट लायर डेटामध्ये
असूनही आपण साधारण

Malayalam: 
ഉദാഹരണത്തിന്, ഡാറ്റ
outliers ആണെങ്കില്‍ ഞാന്‍
ഉദ്ദേശിക്കുന്നത്,
ഞാന്‍ അത് വൃത്തിയാക്കണം.
അതിന് കരുത്തുറ്റ
രീതികളും ഉണ്ട്.
outliers ഡാറ്റയില്‍ തന്നെ
തുടരട്ടെ.
നിങ്ങള്‍ക്ക് നല്ല
എസ്റ്റിമേറ്റുകള്‍
നേടാന്‍ കഴിയുമെന്ന്
ഞങ്ങള്‍ പറയുന്നു.
അല്ലെങ്കില്‍ നമ്മള്‍
ഫില്‍ട്ടര്‍ ചെയ്യേണ്ടതുണ്ട്.
നേരത്തെ പറഞ്ഞിട്ടില്ലാത്ത
ഒരു കാര്യം ഡാറ്റ
വിഭജിക്കലാണ്.
നിങ്ങള്‍ ഒരു മോഡല്‍
നിര്‍മ്മിക്കുകയാണെങ്കിലോ
അല്ലെങ്കില്‍ സവിശേഷതകളെ
വേര്‍തിരിച്ചുകൊണ്ട്
വര്‍ഗ്ഗീകരണം നടപ്പിലാക്കുന്നുണ്ടെങ്കിലോ,
എപ്പോഴും ക്രോസ്
മൂല്യനിര്‍ണ്ണയത്തിനായി
ഡാറ്റയുടെ ഒരു ഭാഗം
നിങ്ങള്‍ക്ക് ഉണ്ടായിരിക്കണം.
ഡാറ്റയില്‍ നിങ്ങള്‍
പരിശീലിപ്പിച്ച
മാതൃക ഞങ്ങള്‍ സ്വീകരിക്കുകയും
അത് സമാനമായ പരീക്ഷണാത്മക
നിലകളില്‍ നിന്ന്
പുറത്തുവന്നിട്ടുള്ള
ഒരു പുതിയ ഡാറ്റയില്‍
പരിശോധിക്കുകയും
വേണം. അല്ലെങ്കില്‍
പരിശീലന ഡേറ്റയുടെ
അടിസ്ഥാനത്തില്‍
ഒരു ക്ലാസ്സിഫെയര്‍
നിര്‍മ്മിച്ചിട്ടുണ്ടെങ്കില്‍,
അപ്പോള്‍ നമ്മള്‍
ഞാന്‍ അപ്ഡേറ്റ്
ചെയ്ത ഡാറ്റ സെറ്റ്
ഉപയോഗിച്ച് ക്ലാസ്സിഫയര്‍
പരിശോധിക്കണം.
അതിനാല്‍, ക്രോസ്
മൂല്യനിര്‍ണ്ണയത്തിനായി

Bengali: 
এখন, এটি একটি খুব
কঠিন পরিস্থিতি করে
তোলে।
এটা নিছক নির্ধারিত
বা স্টোকাস্টিক জিনিসতে
রাখে না এবং আমরা
এটি সম্পর্কে আলোচনা
করবো, তবে মূলত এটি
নির্ণয়মূলক নয়।
ডেটা একটি নির্ধারক
প্রক্রিয়া থেকে
বেরিয়ে আসে না কারণ
DGP এর একটি অংশ, যা
একটি সেন্সর, সঠিকভাবে
বোঝা যায় না।
সাধারণভাবে, এই অবস্থা;
সেন্সর পুরোপুরি
বোঝা যায় না।

Marathi: 
योग्य अंदाज लावू
शकतो, किंवा आम्हाला
फिल्टर करावा लागू
शकतील.
मी आधी उल्लेख केलेले
एक गोष्ट म्हणजे
डेटा विभाजित करणे.
आपण एखादे मॉडेल
तयार करत असल्यास
किंवा आपण वैशिष्टे
काढुन वर्गीकरण करीत
असाल तर बर्याचदा
आपल्याला क्रॉस प्रमाणीकरणासाठी
डेटाचा एक भाग असावा.
आपण डेटावर प्रशिक्षित
केलेले मॉडेल घ्यावे
आणि नवीन डेटावर
त्याची परीक्षा घ्यावी
जी समान प्रायोगिक
शर्तींमधून बाहेर
आली आहे, किंवा आम्ही
ट्रेनिंग डेटावर
आधारीत एक क्लासिफायरियर
तयार केला असेल तर
आपण क्लासिफायरिझरचा
भाग मी अद्ययावत
केलेल्या डेटा सेट
तर, नेहमी क्रॉस प्रमाणीकरणासाठी
सेट केलेल्या डेटाचा
भाग ठेवा. आणि काहीवेळा
हे इतिहासकारांकडून
येणार्या डेटामध्ये
उद्भवणारे परिमाण
किंवा संक्षेप त्रुटींचे
मूल्यांकन करणे आवश्यक
असू शकते. हे दिवस
इतके खराब होऊ शकत
नाही, परंतु आपण डेटा
पाहत असल्यास 10 वर्षांपूर्वी
असू शकते आणि याप्रमाणे
ते अत्यंत प्रमाणावर
किंवा संकुचित केले

Kannada: 
ಮತ್ತು ಈ ಸರಾಸರಿಗಳನ್ನು
ಎರ್ಗೊಡಿಕ್ ಪ್ರಕ್ರಿಯೆ
ಎಂದು ಕರೆಯುವುದನ್ನು
ವ್ಯಾಖ್ಯಾನಿಸಲು ಬಳಸಲಾಗುತ್ತದೆ;
ನಾವು ಅದನ್ನು ಪ್ರವೇಶಿಸುವುದಿಲ್ಲ.
ಅಂತಿಮವಾಗಿ, ಎರಡು
ಪದಗಳು ಪಕ್ಷಪಾತ ಮತ್ತು
ಮಾರ್ಪಾಡುಗಳು ದತ್ತಾಂಶ
ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಬಹಳ ಮುಖ್ಯವಾಗಿವೆ
ಏಕೆಂದರೆ ಅವುಗಳು ಕೆಲವು
ನಿಯತಾಂಕ ಅಥವಾ ಒಂದು
ಪ್ಯಾರಾಮೀಟರ್ಗಳ ಗುಂಪನ್ನು
ಅಂದಾಜು ಮಾಡುವ ದೋಷವನ್ನು
ಕುರಿತು ಮಾತನಾಡುತ್ತವೆ.
ಬಯಾಸ್ ಒಂದು ವ್ಯವಸ್ಥಿತ
ದೋಷವಾಗಿದ್ದು, ಅದು
ಕೊನೆಗೊಳ್ಳುತ್ತದೆ;
ಪ್ರತಿ ಅಂದಾಜು ವ್ಯಾಯಾಮವು
ನಿಮಗೆ ತಪ್ಪು ಎಂದು
ಅಂದಾಜು ನೀಡುತ್ತದೆ;
ಅದರ ಬಗ್ಗೆ ಯಾವುದೇ
ಸಂದೇಹವೂ ಇಲ್ಲ. ಅಂದಾಜು
ಮತ್ತು ಸತ್ಯದ ನಡುವಿನ
ವ್ಯತ್ಯಾಸವು ಅಕಸ್ಮಾತ್ತಾಗಿರಬಹುದು
ಅಥವಾ ನಿಮ್ಮ ಅಂದಾಜಿನ
ಕೊರತೆ ಅಥವಾ ಕೊರತೆಯ

Gujarati: 
શરૂ થશે. અને જો તમને
રસ હોય તો તમારે તેમાં
બેસવું જોઈએ કારણ
કે તે દરેક આંકડાકીય
માહિતી ના એનાલિસિસ(analysis)
અને અભ્યાસનો અભિન્ન

English: 
we prepare our data, through many data pre-processing
steps; depends on what kind of problems the
data has.
For example, if the data is outliers, I mean,
I have to clean up, but there are also robust
methods. We say let the outliers stay in the
data and still going to get you decent estimates
and so on, or we may have to filter and so
on.
The one thing that I didn’t mention earlier
is partitioning the data. If you are building
a model or if you are performing classification
by extracting features and so on, always you
should have a part of the data in hands for
cross validation. We should take the model
that you trained on the data and test it on
a fresh data which has come out of similar
experimental conditions, or if we have built
a classifier based on the training data, then
we should test the classifier on the part
of the data set that I have updated. So, always

Tamil: 
உங்கள் மாதிரிகள்
சரியாக தேர்வு செய்யுங்கள்.
மாடலிங் (modelling) திறமை
அல்லது மதிப்பிடுதலின்
அடுத்த விரிவுரை
பற்றி சரியாகப் பேசுவோம்.
எனவே, இப்போது இதை
கொஞ்சம் கொஞ்சமாக
விரிவுபடுத்துவோம்.
எனவே, நாம் டேட்டா
அனாலிசிஸ் (Data Analysis)க்குச்
செல்வதற்கு முன்,
முதல் படி, நாம் கற்றுக்கொண்டபடி,
சில அடிப்படை கேள்விகளை
கேட்க வேண்டும்.
என்ன வகை அனாலிசிஸ்
(Analysis) தேவைப்படுகிறது?
அனாலிசிஸ் (Analysis), முன்கணிப்பு
மற்றும் பலவகைப்பட்டவை
என்பதால், அது அனாலிசிஸ்
(Analysis) முழுவதையும்
மாற்றியமைக்கிறது.
டேட்டா (Data)எங்கிருந்து
வருகிறது?
டேட்டா (Data)வின் ஆதாரங்கள்
- நாங்கள் கேட்டோம்,
எங்களிடம் டைம் டொமைன்
(time domain), டேட்டா பிரெயூனிசி
டொமைன் (data frequency domain)
, பயோலொஜிக்கல் ப்ரோஸ்ஸ்ஸ்
டேட்டா (biological process data)
மற்றும் பல. டேட்டா
(Data) எவ்வாறு பெற்றது?
என்ன வகையான வன்பொருள்
பயன்படுத்தப்பட்டது?
தரவு சேகரிக்கப்பட்ட
ஒரு மனிதனா?
அது சென்சார் (sensor)?
ஒரு சென்சார் (sensor)
என்றால், மாதிரி
விகிதம் என்ன?
பல கேள்விகளுக்கு
எங்களால் எப்படி
எதிர்பார்க்க முடியும்
என்று ஒரு நல்ல அனாலிசிஸ்
(Analysis) தர முடியும்,
மற்றும் நான் எப்படி
பயன்படுத்த வேண்டும்
என்று அனாலிசிஸ்
(Analysis) கருவிகள் இருக்க
வேண்டும், மற்றும்
நான் என்ன தேடிக்கொண்டிருக்க
வேண்டும் என்று அறிய
வேண்டும்.
பின்னர், நிச்சயமாக,
தரவு எவ்வளவு தகவல்

Hindi: 
तो मेरा मतलब है, मुझे
साफ करना है, लेकिन
मजबूत तरीके भी हैं।
हम कहते हैं कि आउटलाइजर्स
डेटा में रहें और
अभी भी आपको सभ्य
अनुमान प्राप्त करने
जा रहे हैं, या हमें
फ़िल्टर करना पड़
सकता है और इसी तरह।
एक चीज जिसे मैंने
पहले उल्लेख नहीं
किया था, डेटा को विभाजित
कर रहा है।
यदि आप एक मॉडल बना
रहे हैं या यदि आप
सुविधाओं को निकालने
के द्वारा वर्गीकरण
कर रहे हैं और इसी
तरह, हमेशा पार सत्यापन
के लिए हाथों में
डेटा का हिस्सा होना
चाहिए।
हमें उस मॉडल को लेना
चाहिए जिसे आपने
डेटा पर प्रशिक्षित
किया है और इसे एक
नए डेटा पर परीक्षण
करना है जो समान प्रयोगात्मक
स्थितियों से बाहर
आया है, या यदि हमने
प्रशिक्षण डेटा के
आधार पर वर्गीकृत
बनाया है, तो हमें
क्लासिफायर का परीक्षण
करना चाहिए डेटा
सेट जो मैंने अपडेट
किया है।
इसलिए, हमेशा क्रॉस
सत्यापन के लिए डेटा
सेट का हिस्सा रखें।
और कभी-कभी इतिहासकारों
से आने वाले डेटा
में उत्पन्न होने
वाली मात्रा या संपीड़न

Malayalam: 
സജ്ജമാക്കിയ ഡാറ്റയുടെ
ഭാഗം എപ്പോഴും സൂക്ഷിക്കുക.
ചില സമയങ്ങളില്‍
ചരിത്രകാരന്മാരില്‍
നിന്ന് ലഭിക്കുന്ന
വിവരങ്ങളില്‍ ഉണ്ടാകുന്ന
quantisation അല്ലെങ്കില്‍
കംപ്രഷന്‍ പിശകുകള്‍
വിലയിരുത്തുന്നതിന്
അത് ആവശ്യമാണ്.
ഈ ദിവസങ്ങളില്‍ അത്
വളരെ മോശമായിരിക്കില്ല.
പക്ഷേ നിങ്ങള്‍ ഡാറ്റയില്‍
നോക്കുകയാണെങ്കില്‍
10 വര്‍ഷം മുമ്പ്തന്നെ,
അതും വളരെ വലുതാകുകയോ
അല്ലെങ്കില്‍ ചുരുക്കപ്പെടുകയോ
ചെയ്തിരുന്നു.
നിങ്ങളുടെ വിവരവിശകലനത്തിന്‍റെ
ഗതിയെ ഗണ്യമായി മാറ്റാന്‍
അതിന് കഴിയും.
ഭൗതിക പ്രക്രിയയുടെ
ഭാഗമല്ലാത്ത അനാവശ്യമായ
നോണ്‍ലീനിയാരിറ്റികള്‍
ഉണ്ടാകും.
ഇത് നിങ്ങളുടെ ഡാറ്റ
aquisition പ്രക്രിയയുടെ
ഭാഗമാണ്.
തീര്‍ച്ചയായും, നമ്മള്‍
ദൃശ്യവല്‍ക്കരണത്തെക്കുറിച്ച്
സംസാരിച്ചു.
വൈവിധ്യമാര്‍ന്ന
പ്ലോട്ടുകള്‍, ബാര്‍
ചാര്‍ട്ടുകള്‍ തുടങ്ങി
ലളിതമായ പ്രവണതയില്‍
നമുക്ക് നോക്കാം.
പട്ടിക വ്യക്തമാവില്ല.
പക്ഷേ, ചെയ്യുന്നു.
അങ്ങനെ ഡാറ്റ വിശകലനത്തിന്‍റെ
ഓരോ ഘട്ടത്തിലും
വിഷ്വലൈസേഷന്‍ ഒരു
അവിഭാജ്യഘടകമാണ്.
അതിനാല്‍ ഞങ്ങള്‍
വിശകലനം ചെയ്യേണ്ടതിന്‍റെ
ആവശ്യത്തെ ഊന്നിപ്പറയുന്ന
ഋിരെീായല ഡാറ്റ സെറ്റുകളെക്കുറിച്ച്

English: 
keep portion of the data set for cross validation.
And sometimes it may be necessary to assess
quantization or compression errors that may
arise in data that come from historians. These
days it may not be so bad, but if you are
looking at data may be 10 year ago, and so
on, they be in highly quantized or compressed,
and that can significantly change the course
of your data analysis. They may introduce
unnecessary non-linearities which are not
a part of the physical process. It’s just
a part of your data acquisition process.
And of course, we talked about visualization
where in we could look at simple trend to
high dimensional plots, bar charts and so
on. The list is obviously not exhaustive,
but always convert numbers to pictorial representations
before, during, and after analysis. So visualization
is a part - integral part - of every stage
of the data analysis. So, we have talked about

Marathi: 
जातात आणि ते आपल्या
डेटा विश्लेषणाचा
अभ्यासक्रम बदलू
शकतात.
ते भौतिक प्रक्रियेचा
भाग नसलेल्या अनावश्यक
गैर-रेषेची ओळख करून
देतात.
हा आपल्या डेटा प्राप्ती
प्रक्रियेचा फक्त
एक भाग आहे.
आणि नक्कीच, आम्ही
दृष्यक्रमाची चर्चा
केली जेथे आम्ही
साध्या व्याप्ती,
उच्च-आयामी भूखंड,
बार चार्ट इत्यादींकडे
पाहू शकतो. सूची जाहीरपणे
स्पष्ट नाही, परंतु
सर्वप्रथम विश्लेषणानंतर,
दरम्यान आणि नंतर
चित्रमय प्रतिवेदनांमध्ये
रूपांतरित करते.
डेटा व्हिज्युअलायझेशनच्या
प्रत्येक टप्प्यामध्ये
व्हिज्युअलायझेशन
हे एक भाग - अविभाज्य
भाग आहे. म्हणून, आम्ही
एन्स्कॉम्बे डेटा
सेटबद्दल बोललो आहोत
ज्यात मूलतः व्हिज्युअलायझेशनची
गरज यावर जोर दिला
जातो.
विश्लेषणातील मुख्य
पायरी म्हणजे आपण
बोलणार आहोत आणि
नंतर व्याख्यानाचे
अंतिम निष्कर्ष काढू.
विश्लेषण डोमेन निवडा.
डोमेनमध्ये जे काही
अर्थ आहे ते आपण इथे
मिळवलेल्या डोमेनमधील
डेटाचे विश्लेषण
करू इच्छित आहोत.
साधारणपणे वेळ एक
डोमेन-स्वतंत्र डोमेन
असतो - ज्यामध्ये
आम्ही डेटा गोळा
करतो, परंतु आम्ही

Hindi: 
त्रुटियों का आकलन
करना आवश्यक हो सकता
है।
इन दिनों यह इतना
बुरा नहीं हो सकता
है, लेकिन यदि आप डेटा
को देख रहे हैं तो
10 साल पहले हो सकता
है, और इसी तरह, वे
अत्यधिक मात्रा में
या संपीड़ित हो सकते
हैं, और यह आपके डेटा
विश्लेषण (DATA ANALYSIS)के
पाठ्यक्रम को महत्वपूर्ण
रूप से बदल सकता है।
वे अनावश्यक गैर-रैखिकताएं
पेश कर सकते हैं जो
भौतिक प्रक्रिया
का हिस्सा नहीं हैं।
यह सिर्फ आपके डेटा
अधिग्रहण प्रक्रिया
का एक हिस्सा है।
और निश्चित रूप से,
हमने विज़ुअलाइजेशन
के बारे में बात की
जहां हम उच्च आयामी
भूखंडों, बार चार्टों
आदि के लिए सरल प्रवृत्ति
को देख सकते थे।
सूची स्पष्ट रूप
से संपूर्ण नहीं
है, लेकिन विश्लेषण
के पहले, दौरान, और
बाद में चित्रों
को हमेशा चित्रमय
प्रस्तुतिकरण में
परिवर्तित करती है।
तो विज़ुअलाइजेशन
डेटा विश्लेषण (DATA
ANALYSIS)के प्रत्येक चरण
का एक हिस्सा - अभिन्न
अंग है।
इसलिए, हमने Enscombe डेटा
सेट के बारे में बात
की है जो मूल रूप से
विज़ुअलाइजेशन की
आवश्यकता पर जोर
देती है।

Kannada: 
ಕಾರಣವೇ ಎಂಬ ಪ್ರಶ್ನೆ
ಇದೆ. ನಿಮ್ಮ ಅಂದಾಜು
ವ್ಯಾಯಾಮದಲ್ಲಿ ಅಥವಾ
ನಿಮ್ಮ ಅಂದಾಜಿನಲ್ಲಿ
ಪಕ್ಷಪಾತವಿದೆಯೇ ಎಂದು
ನಿಮಗೆ ಹೇಗೆ ಗೊತ್ತು?
ಈ ಚಿಂತನೆಯ ಪ್ರಕ್ರಿಯೆಯನ್ನು
ಕಲ್ಪಿಸಿಕೊಳ್ಳಿ; ನಾನು
ಸಂಗ್ರಹಿಸಿದೆ ನಾವು
ಒಂದು ಪ್ರಕ್ರಿಯೆಗೆ
ನೂರು ಮಾಹಿತಿ ದಾಖಲೆಗಳು
ಅಥವಾ ಸಾವಿರ ಡೇಟಾ
ದಾಖಲೆಗಳು ಅಥವಾ ಸಾವಿರ
ಡೇಟಾ ದಾಖಲೆಗಳು ಹೇಳುತ್ತಾರೆ,
ಮತ್ತು ನಾನು ಮಾದರಿ
ಡೇಟಾ ದಾಖಲೆಗಳು ಸರಾಸರಿ
ಅರ್ಥ. ನಾನು ಸರಾಸರಿಯಾದರೆ,
ನಾವು ಸಾವಿರ, ಸುಮಾರು
ಒಂದು ಮಿಲಿಯನ್ ಡಾಟಾ
ರೆಕಾರ್ಡ್ಗಳನ್ನು
ಹೇಳೋಣ, ಪ್ರತಿ ಡಾಟಾ
ರೆಕಾರ್ಡ್ಗೆ ನಾನು
ಒಂದು ಮಾದರಿಯನ್ನು
ಅರ್ಥ ಮಾಡಿಕೊಂಡಿದ್ದೇನೆ;
ಮತ್ತು ಮಿಲಿಯನ್ ಡೇಟಾ
ದಾಖಲೆಗಳಿಗಾಗಿ, ಆದ್ದರಿಂದ

Bengali: 
আপনি খুব খুব খুব
কম শব্দ আছে একটি
খুব, খুব সুন্দর সেন্সর
ডিজাইন করতে পারেন,
কিন্তু কোন সেন্সর
নিখুঁত এবং কোন সেন্সর
সত্যিই পুরোপুরি
বোঝা যায়।
সুতরাং, প্রকৃতপক্ষে,
একটি নির্ধারক প্রক্রিয়া
মত কিছুই নেই।
এটি একটি আদর্শিকীকরণ,
এটি ডেটা বিশ্লেষণে
এবং তত্ত্ব উন্নয়নে
খুবই উপযোগী।
এখন, স্পষ্টতই, স্টাচাস্টিকটি
ডিস্ট্রিটিস্টিকের
জন্য পাল্টা অংশ,
যেখানে আমরা বলি

Tamil: 
தருகிறது - அது ஒரு
பிட் தகுதி, ஆனால்
சில குறிப்பிட்ட
அளவிலான தகவல்களும்
உள்ளன.
நாம் அதைப் பற்றி
பேசமாட்டோம், ஆனால்
நான் சொன்னது போல,
தரவரிசைப் பற்றாக்குறையையும்
காணாமல் போயிருந்தார்களோ
இல்லையோ அது தரத்தை
சோதிக்கும்.
கடைசியாக, ஆனால்
மிக முக்கியமானது
- தரவு உருவாக்கும்
செயல்முறையின் அடிப்படையில்
என்ன ஊகங்கள் செய்யப்படுகின்றன
என்பது தெளிவாக இருக்க
வேண்டும்.
நீங்கள் தவறாக இருக்கலாம்.
தொடக்கத்தில், தவறான
அனுமானங்களை நாங்கள்
செய்யலாம், ஒரு உறுதியான
செயல்பாட்டை நிர்ணயிக்க
முடிகிறது, நாம்
ஒரு நேர்கோட்டு செயல்முறை
நேராக இருக்க வேண்டும்,
ஒரு நிலையான நிலை
செயல்முறை மாறும்
மற்றும் அதனால்;
அது சாத்தியமாகும்.
ஆனால் டேட்டா அனாலிசிஸ்
(Data Analysis) முழுவதும்
நாம் செய்துள்ள ஊகங்களுக்கு
நாம் ஒத்துழைக்க
வேண்டும், மேலும்
தேர்வு மற்றும் நிலையான
மற்றும் இணக்கமானதாக
இருக்க வேண்டும்
- அதாவது சரியான கருவிகளை
தேர்வு செய்ய வேண்டும்,
அதனால் நீங்கள் தவறு
செய்திருந்தால்,
இறுதியில், நாம்
ஒரு தவறு செய்துவிட்டோம்
என்பதை அறிவீர்கள்.
பின்னர், நாங்கள்
திரும்பிச் சென்று
திருத்தங்கள் செய்கிறோம்.
நான் உண்மையில் இந்த
விவரம் செல்ல போவதில்லை.
நாம் ஏற்கனவே இதைப்
பற்றி பேசினோம்.
எனவே, நீங்கள் ஆரம்பகால
கேள்விகளைப் பெற்றிருந்தால்,
பல தரவு முந்தைய
செயலாக்க வழிமுறைகளின்படி
எங்கள் தரவை தயாரிப்போம்;
தரவு என்ன வகையான
பிரச்சினைகள் சார்ந்தது.

Gujarati: 
ભાગ છે. પછી, અમારી
પાસે ડેટાનું એનાલિસિસ(analysis)
કદાચ ભૂલ ના તપાસ
માટે છે. જેમ મેં અગાઉ

Kannada: 
ನಾನು ಮಿಲಿಯನ್ ಸ್ಯಾಂಪಲ್
ಎಂದರೆ.
ನಾನು ಮಾದರಿಯನ್ನು
ಅರ್ಥೈಸಿದರೆ, ಮಿಲಿಯನ್
ಮಾದರಿ ನನಗೆ ಅರ್ಥ,
ನಾನು ಸತ್ಯಕ್ಕೆ ಬಹಳ
ಹತ್ತಿರವಾಗಿರಬೇಕು.
ಕೇವಲ ಮಿಲಿಯನ್ ಸಾಧ್ಯತೆಗಳು
ಇದ್ದಲ್ಲಿ, ನಾನು ಸತ್ಯವನ್ನು
ಪಡೆಯಬೇಕು, ಆದರೆ ಈ
ಮಿಲಿಯನ್ ಮಾದರಿಯ ಸರಾಸರಿಯ
ಸರಾಸರಿ ಅಥವಾ ಮಾದರಿ
ವಿಧಾನ ಮತ್ತು ಸತ್ಯದ
ನಡುವೆ ಇನ್ನೂ ವ್ಯತ್ಯಾಸ
ಕಂಡುಬಂದರೆ, ವ್ಯವಸ್ಥಿತ
ದೋಷವಿದೆ.
ನಾವು ಕುರಿತು ಬರೆದ
ಈ ಸಮಗ್ರ ಸರಾಸರಿ, ನಾನು
ಮೇಲೆ ಬರೆದಂತೆ, ಅದನ್ನು
ನಿರೀಕ್ಷೆ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.
ಆದ್ದರಿಂದ ಬೇರೆ ರೀತಿಯಲ್ಲಿ
ಹೇಳುವುದಾದರೆ, ಪಕ್ಷಪಾತಕ್ಕೆ
ಮರಳಿ ಬಂದಾಗ, ಅಂದಾಜಿನ
ನಿರೀಕ್ಷಿತ ಮೌಲ್ಯವು
ಸತ್ಯದಿಂದ ಭಿನ್ನವಾಗಿದ್ದರೆ,
ಅಂದಾಜಿನ ಪ್ರಕಾರ ಪಕ್ಷಪಾತವಿದೆ
ಎಂದು ನಾವು ಹೇಳುತ್ತೇವೆ.

Malayalam: 
നേരത്തെ സംസാരിച്ചിട്ടുണ്ട്.
വിശകലനത്തിലെ പ്രധാനഘട്ടങ്ങള്‍
എന്തൊക്കെയാണ് നാം
സംസാരിക്കും.
തുടര്‍ന്ന് പ്രഭാഷണം
അവസാനിപ്പിക്കും.
വിശകലനത്തിന്‍റെ
ഡൊമെയ്ന്‍ തിരഞ്ഞെടുക്കുക.
ഇവിടെയുള്ള ഡൊമെയ്നില്‍
നിന്ന് നമ്മള്‍ അര്‍ത്ഥമാക്കുന്നത്.
അതേ ഡൊമെയ്നിലുള്ള
ഡാറ്റ വിശകലനം ചെയ്യാന്‍
ഞങ്ങള്‍ക്ക് താല്പര്യമുണ്ടോ
എന്നതാണ്.
സാധാരണസമയം എന്നത്
ഒരു ഡൊമെയ്ന്‍ - ആരെയും
ആശ്രയിക്കാത്ത ഡൊമെയ്ന്‍
ആണ്. അതില്‍ ഞങ്ങള്‍
ഡാറ്റ ശേഖരിക്കും.
പക്ഷേ സമയരേഖയില്‍
ഡാറ്റ വിശകലനം ചെയ്യണമെന്നില്ല.
ചിലപ്പോള്‍ നമുക്ക്
ആവൃത്തി ഡൊമെയ്നിലേക്ക്
നിങ്ങേണ്ടിവരും.
വാസ്തവത്തില്‍, പീരിയോഡിസിറ്റി
ഡിറ്റക്ടറില്‍ പിന്തുടരുന്ന
സാധാരണ നടപടിക്രമമാണത്.
വൈബ്രേഷന്‍ മെഷീനുകള്‍,
ഇസിജി അല്ലെങ്കില്‍
ഇഇജി ഡാറ്റയില്‍
നിന്ന് വരുന്ന വിവരങ്ങള്‍
പോലും അത്തരം ഡാറ്റകള്‍
പരിശോധിക്കുകയാണെങ്കില്‍,
അത്തരം ഡാറ്റകള്‍ക്കായി,
ആവൃത്തിയുടെ ഉപഭോഗ
വിശകലനം വളരെ സൗകര്യപ്രദമായ
ഒരു ഡൊമെയ്ന്‍ ആണ്.
കാരണം ഇത് പ്രക്രിയയുടെ
ഭൗതിക പ്രത്യേകതകള്‍
നേരിട്ട് വിലയിരുത്തുന്നു.
പല തവണ നിങ്ങള്‍
സംയുക്ത സമയം-ആവൃത്തി

Bengali: 
যে DGP সঠিকভাবে পূর্বাভাস
দেয় না বা জানা যায়
না বা আপনি বলতে পারেন
যে ডেটাতে অনিশ্চয়তা
আছে এবং তাই।
এবং হিসাবে আমি বলেন,
প্রথাগতভাবে, কোন
প্রক্রিয়া নির্ণায়ক
ভিত্তিক কারণ নিখুঁত
জ্ঞান পরিচিত হয়
না।
এখন, এর অর্থ কি প্রতিটি
ডেটা উৎপাদনের প্রক্রিয়াটিকে
স্টোচাস্টিক হিসেবে
গণ্য করা হবে?
আসলে তা না. এখনও একটি
নির্দিষ্ট পার্থক্য
এখনও নিয়ন্ত্রক
এবং stochastic প্রক্রিয়ার
মধ্যে দেখা যায়,
এমনকি প্রথা এমনকি

Tamil: 
உதாரணமாக, டேட்டா
(Data) மீறல் என்றால்,
அதாவது, நான் சுத்தம்
செய்ய வேண்டும்,
ஆனால் வலுவான முறைகளும்
உள்ளன.
தரவரிசைப் புள்ளிவிவரங்கள்
தரவில்லாமல் இருப்பதோடு,
நீங்கள் இன்னும்
கௌரவமான மதிப்பீட்டையும்
பெறலாம், அல்லது
நாங்கள் வடிகட்ட
வேண்டியிருக்கும்.
நான் முன்பு குறிப்பிடவில்லை
என்று ஒன்று டேட்டா
பகிர்ந்து (Data sharing).
நீங்கள் ஒரு மாடலை
(model) உருவாக்குகிறீர்கள்
அல்லது நீங்கள் அம்சங்களை
பிரிப்பதன் மூலம்
வகைப்படுத்தி இருந்தால்,
எப்பொழுதும் குறுக்கு
மதிப்பீட்டிற்கான
தரவின் ஒரு பகுதியை
நீங்கள் வைத்திருக்க
வேண்டும்.
நீங்கள் தரவில் பயிற்றுவித்த
மாதிரியை எடுத்துக்
கொள்ள வேண்டும்,
அதேபோல் சோதனை நிலைகளில்
இருந்து வெளியே வந்த
புதிய தரவை சோதித்துப்
பார்க்க வேண்டும்
அல்லது பயிற்சி தரத்தின்
அடிப்படையில் ஒரு
வகுப்பை உருவாக்கியிருந்தால்,
நாம் வகுப்பறை ஒன்றை
நான் மேம்படுத்திய
தரவு தொகுப்பு.
எனவே, எப்போதும்
குறுக்கு பகுதியை
வைத்து தரவு சரி
பார்த்தல் அமைக்க
வேண்டும்.
சில நேரங்களில் அது
வரலாற்று அறிஞர்களிடமிருந்து
வரும் தரவுகளில்
எழும் அளவீடு அல்லது
சுருக்க பிழைகள்
மதிப்பீடு செய்யப்பட
வேண்டியது அவசியமாக
இருக்கலாம்.
இந்த நாட்களில் அது
மிகவும் மோசமாக இருக்காது,
ஆனால் நீங்கள் தரவுகளைப்
பார்த்தால் 10 ஆண்டுகளுக்கு
முன்பு இருக்கலாம்,
அதனால் அவை மிகவும்
குவாண்டம் (quantum) அல்லது
சுருக்கப்பட்டவையாக
இருக்கும், மேலும்
இது உங்கள் தரவு
பகுப்பாய்வின் கணிசமாக
மாறும்.

Gujarati: 
સમજાવી હતી, ડૉકટર,
જ્યારે ડૉકટર ઇસીજીની
તરફ જુએ છે, તે અસંગતિની
શોધમાં હોય છે અથવા

Marathi: 
समय डोमेनमधील डेटाचे
विश्लेषण करू इच्छित
नाही. काहीवेळा आम्हाला
वारंवारता डोमेनवर
जाण्याची इच्छा असू
शकते. खरेतर, ही एक
नेहमीची सामान्य
प्रक्रिया आहे ज्याचा
कालावधी कालावधीतील
डिटेक्टर आहे. आपण
वायुमंडलातील डेटा
किंवा कंपन यंत्र,
ईसीजी किंवा ईईजी
डेटा यासारख्या सर्व
डेटासाठी पाहिल्यास,
वारंवारता डोमेन
विश्लेषणाचा विश्लेषणाचा
अतिशय सोयिस्कर डोमेन
आहे कारण तो अशा वैशिष्ट्यांमधून
प्रगट करतो की जी
प्रत्यक्ष शारीरिक
वैशिष्ट्यांशी संबंधित
असू शकते. प्रक्रिया
आणि अर्थातच, अनेक
वेळा आपल्याला संयुक्त
वेळ वारंवारता विश्लेषण
करावे लागते.
वेव्हलेट त्यापैकी
एक आहे. म्हणून, विश्लेषणाचे
डोमेन निवडा आणि
गरज नसलेली वेळ निवडा,
ती जागा देखील असू
शकते. रेकॉर्डिंग
स्पेक्ट्रोस्कोपी
डेटा जसे क्रोमॅटोग्राफच्या
वारंवारतेचे एक कार्य
आहे तसाच एक वेळा
डेटा आपल्यापर्यंत
येऊ शकतो. मग दुसरा
निर्णय ज्यावर आपण
निर्णय घ्यावा लागतो
ते कमीपणात्मकता
कमी करते आणि विशेषत:
जेव्हा आम्ही मोठे
आयामी डेटा पाहत

Hindi: 
विश्लेषण में मुख्य
कदम यह है कि हम किस
बारे में बात करेंगे
और फिर व्याख्यान
निष्कर्ष निकालेंगे।
विश्लेषण के डोमेन
का चयन करें।
यहां डोमेन द्वारा
हमारा क्या मतलब
है कि हम उसी डोमेन
में डेटा का विश्लेषण
करना चाहते हैं जो
इसे प्राप्त किया
गया है।
आम तौर पर समय एक डोमेन-निर्भर
डोमेन है - जिसमें
हम डेटा एकत्र करते
हैं, लेकिन हम समय
डोमेन में डेटा का
विश्लेषण नहीं करना
चाहते हैं।
कभी-कभी हम आवृत्ति
डोमेन में स्थानांतरित
करना चाहते हैं।
असल में, यह एक बहुत
ही सामान्य प्रक्रिया
है जो आवधिकता डिटेक्टर
में होती है।
यदि आप ऐसे सभी डेटा
के लिए वायुमंडलीय
डेटा या यहां तक ​​कि
कंपन मशीनरी, ईसीजी
या ईईजी डेटा से आने
वाले डेटा को देखते
हैं, तो आवृत्ति डोमेन
विश्लेषण विश्लेषण
का एक बहुत ही सुविधाजनक
डोमेन है क्योंकि
यह उन सुविधाओं को
प्रकट करता है जो
सीधे शारीरिक विशेषताओं
से संबंधित हो सकते
हैं प्रक्रिया।
और निश्चित रूप से,
आपको कई बार संयुक्त
समय आवृत्ति विश्लेषण
करना होता है।
वेवलेट्स उनमें से
एक है।

English: 
the Enscombe data sets that basically emphasise
a need for visualization.
The core steps in analysis is what we will
talk about and then conclude the lecture.
Select the domain of analysis. What we mean
by domain here is whether we want to analyze
the data in the same domain that it has been
obtained. Normally the time is a domain -independent
domain - in which we collect data, but we
may not want to analyze the data in the time
domain. Sometimes we may want to move to frequency
domain. In fact, that ‘s a very common procedure
that’s followed in periodicity detector.
If you look at atmospheric data or even data
coming from vibration machinery, ECG or EEG
data, for all such data, the frequency domain
analysis is a very convenient domain of analysis
because it reveals the features that can be
directly related to physical characteristics
of the process. And of course, many a times

Tamil: 
அவர்கள் உடல் செயல்பாட்டின்
ஒரு பகுதியாக இல்லாத
தேவையற்ற அல்லாத
நேர்காணல்களை அறிமுகப்படுத்தலாம்.
இது உங்கள் தரவு
கையகப்படுத்தல்
செயல்பாட்டின் ஒரு
பகுதியாகும்.
நிச்சயமாக, நாங்கள்
காட்சிப்படுத்தலைப்
பற்றி பேசினோம்,
அங்கு உயர் பரிமாண
அடுக்குகள், பார்
(bar) வரைபடங்கள் மற்றும்
பலவற்றைக் காணலாம்.
இந்த பட்டியல் வெளிப்படையானது
அல்ல, ஆனால் எண்கள்
முன், எடுக்கும்,
மற்றும் அனாலிசிஸ்
(Analysis)க்குப் பின்னரும்
எண்களை எண்களாக மாற்றுவதென்பதாகும்.
எனவே டேட்டா அனாலிசிஸ்
(Data Analysis) ஒவ்வொரு கட்டத்திலும்
காட்சிப்படுத்தல்
ஒரு பகுதி - ஒருங்கிணைந்த
பகுதியாகும்.
எனவே, நாம் பார்க்கும்
எஸ்கோம்பே (Enscombe) தரவு
தொகுப்புகளை அடிப்படையில்
காட்சிப்படுத்தல்
தேவை வலியுறுத்தி.
அனாலிசிஸ் (Analysis) முக்கிய
படிகள் நாம் பற்றி
பேச மற்றும் விரிவுரை
முடிவுக்கு என்ன.
அனாலிசிஸ் (Analysis) களத்தைத்
தேர்ந்தெடுக்கவும்.
இங்கே உள்ள டொமைன்
(domain) என்ன சொல்கிறதோ
அது பெறப்பட்ட அதே
டொமை(domain)னில் உள்ள
தரவை ஆய்வு செய்ய
வேண்டுமா இல்லையா
என்பதுதான்.
பொதுவாக நேரம் என்பது
ஒரு டொமைன் (domain) - தனித்துவமான
டொமைன் (domain) ஆகும்
- இதில் நாங்கள் டேட்டா
(Data)வை சேகரிக்கிறோம்,
ஆனால் காலவரையறையின்
டேட்டா (Data)வை ஆய்வு
செய்ய நாங்கள் விரும்பவில்லை.
சில நேரங்களில் நாம்
அதிர்வெண் (frequency) களத்திற்கு
செல்ல வேண்டும்.
உண்மையில், அந்த
கால அளவினடிப்படையில்
கண்டறியப்பட்ட பொதுவான
நடைமுறை இது. அதிர்வெண்

Bengali: 
কোন প্রক্রিয়া পুরোপুরি
আন্দাজ করা হয়।
সাধারণত, আমরা বলি
যে একটি প্রক্রিয়া
মূলত নিয়ন্ত্রক
বা প্রধানত স্টোকাস্টিক
এবং আমরা খুব শীঘ্রই
এটি সম্পর্কে আলোচনা
করব; শীঘ্রই এখানে
এই স্লাইড পরে।
তাই, আমরা আগেই উত্থাপিত
প্রশ্নে ফিরে যাব
- কেন ডিটেক্টিস্টিক
বা স্টোকাস্টিক প্রক্রিয়া
থেকে তথ্য এসেছে
তা নিয়ে আমি কেন
উদ্বিগ্ন?
কেন এই অনুমান এত
গুরুত্বপূর্ণ?
এখন, উত্তরটি এমন
কিছু বিষয় যা আমি
আগেই বলেছি - যে তত্ত্ব,
বিশ্লেষণের জন্য
সরঞ্জাম এবং ফলাফলের
ব্যাখ্যাগুলি এই
অনুমানের উপর নির্ভর
করে।
এবং অনেক আছে, অনেক
উদাহরণ যে একটি দিতে

Gujarati: 
જ્યારે રેડિયોલોજિસ્ટ
એ એક્સ-રે(X-Ray) પર નજર
રાખે છે, અમુક મોડેલ
અથવા અમુક સામાન્ય
પરિસ્થિતિઓના નમૂના
પર આધારિત અનુપાતની

Marathi: 
असतो तेव्हा हे आता
अधिक सामान्य बनत
आहे. मोठ्या प्रमाणातील
मल्टिशिअहेबल डेटाचे
विश्लेषण करणे शक्य
नाही, विशेषत: जेव्हा
ते शेकडो आणि हजारो
व इतर गोष्टींवर
जाते आणि आजही ते
अतिशय सामान्य आहेत.
आणि मशीन शिक्षण
अल्गोरिदम या बाबतीत
खूप सुलभ येतात.
मुख्य घटक विश्लेषण,
बिगर-नकारात्मक मॅट्रिक्स
घटक, आणि बर्याच अन्य
परिमाणिती कमी करण्याचे
तंत्र मोठे डायमेंनाएंटी
डेटाचे विश्लेषण
करणारी, मोठ्या आयामी
डेटा आहेत. तर, मला
ज्या पद्धतींचा मागोवा
घेतला आहे किंवा
कमी क्रमाने किंवा
कमी ऑर्डर आयाम मध्ये
विश्लेषण करायचे
की नाही हा निर्णय
घेणे आवश्यक आहे.
आणि सर्वात महत्वाचे
म्हणजे एक योग्य
गणितीय किंवा संख्याशास्त्रीय
साधन निवडणे.
उदाहरणार्थ, मी जर
याचा अर्थ काढू इच्छित
असल्यास, मी अंदाजपत्रकाप्रमाणे
अर्थ, नमुना माध्य
किंवा नमुना मध्यक
निवडू शकतो. आता, मी
अंदाजपत्रकाची म्हणून
केव्हा अंदाजपत्रकाची

Kannada: 
ಈಗ, ವ್ಯತ್ಯಾಸಕ್ಕೆ
ಬರುತ್ತಿದೆ, ಇದು ವಿಭಿನ್ನ
ಡೇಟಾ ದಾಖಲೆಗಳಲ್ಲಿ
ಅಂದಾಜುಗಳ ಹರಡುವಿಕೆಯ
ಅಳತೆಯಾಗಿದೆ.
ಇದು ಅತ್ಯಂತ ಮುಖ್ಯವಾಗಿದೆ
ಏಕೆಂದರೆ ಪ್ರಾಯೋಗಿಕವಾಗಿ
ನಾನು ಒಂದು ಡೇಟಾ ರೆಕಾರ್ಡ್ನೊಂದಿಗೆ
ಮಾತ್ರ ಕೆಲಸ ಮಾಡುತ್ತೇನೆ
ಮತ್ತು ನನ್ನ ಎಲ್ಲಾ
ಡೇಟಾವನ್ನು ಒಂದೇ ಡೇಟಾ
ರೆಕಾರ್ಡ್ನಿಂದ ಮಾಡುತ್ತೇನೆ.
ನಾನು ತಿಳಿದಿರಬೇಕಾದರೆ,
ಪ್ರಶ್ನೆಗೆ ಉತ್ತರವನ್ನು
ನಾನು ತಿಳಿದುಕೊಳ್ಳಬೇಕಾಗಿದೆ
- ನಾನು ಇನ್ನೊಂದು ಡೇಟಾ
ರೆಕಾರ್ಡ್ ಅನ್ನು ಸಂಗ್ರಹಿಸಿದ್ದೇನೆ
ಮತ್ತು ಡೇಟಾ ರೆಕಾರ್ಡ್ನಿಂದ
ಆಕರಗಳನ್ನು ನಾನು ಪಡೆದಿದ್ದೇನೆ,
ಆ ಅವಲೋಕನಗಳು ನಾನು
ಈಗ ನೋಡಿದ್ದಕ್ಕಿಂತ
ಗಮನಾರ್ಹವಾಗಿ ವಿಭಿನ್ನವಾಗಿರುತ್ತದೆ.
ಅವು ವಿಭಿನ್ನವಾಗಿರುತ್ತವೆ,
ನಿಸ್ಸಂಶಯವಾಗಿ, ಸಂಖ್ಯಾತ್ಮಕವಾಗಿರುತ್ತವೆ,
ಆದರೆ ವ್ಯತ್ಯಾಸವು
ತುಂಬಾ ದೊಡ್ಡದಾಗಿದೆ?

Hindi: 
तो, विश्लेषण के क्षेत्र
का चयन करें और समय
की आवश्यकता नहीं
है, यह अंतरिक्ष पर
भी हो सकता है।
कई बार डेटा आवृत्ति
के एक समारोह के रूप
में आपके पास आ सकता
है, जैसे अवलोकन स्पेक्ट्रोस्कोपी
डेटा क्रोमैटोग्राफ
से आवृत्ति के एक
समारोह के रूप में
आता है।
फिर दूसरा जिस पर
हमें निर्णय लेना
पड़ सकता है वह आयाम
में कमी है और विशेष
रूप से जब हम बड़े
आयामी डेटा को देख
रहे हैं।
यह अब तेजी से आम हो
रहा है।
बड़े आयामों में
बहुविकल्पीय डेटा
का विश्लेषण करना
संभव नहीं है, खासकर
जब यह सैकड़ों और
हजारों तक जाता है,
और आज वे बहुत आम हैं।
और मशीन सीखने एल्गोरिदम
इस सम्मान में बहुत
आसान आते हैं।
प्रिंसिपल घटक विश्लेषण,
गैर-नकारात्मक मैट्रिक्स
कारककरण, और कई अन्य
आयामी कमी तकनीक
बड़े आयामी डेटा,
बड़े आयामी डेटा
का विश्लेषण करने
में बहुत शक्तिशाली
हैं।
इसलिए, हमें निर्णय
लेना है कि आयामों
में विश्लेषण करना
है जिसमें मैंने
प्राप्त किया है
या कम आदेश या निचले
क्रम आयाम में।

English: 
you have to do joint time frequency analysis.
Wavelets is one of them. So, select the domain
of analysis and time need not be, it could
be on space also. Many a times data can come
to you as a function of frequency straight
away, like observance spectroscopy data comes
as a function of frequency from the chromatograph.
Then the second one that we may have to take
a decision on is dimentionality reduction
and particularly when we are looking at large
dimensional data. This is now increasingly
becoming common. It’s not possible to analyse
multivariable data in large dimensions, particularly
when it goes to hundreds and thousands and
so on, and they are very common today. And
machine learning algorithms come very handy
in this respect. Principal component analysis,
non-negative matrix factorization, and many
other dimensional reduction techniques are
very powerful in analyzing large dimensionality

Malayalam: 
വിശകലനം നടത്തേണ്ടതുണ്ട്.
Wavelets അവയില്‍ ഒന്നാണ്.
അതിനാല്‍, വിശകലനത്തിന്‍റെ
ഡൊമെയ്ന്‍ തിരഞ്ഞെടുക്കുക.
അവിടെ സമയം ആവശ്യമില്ല.
അത് തുറസ്സായ സ്ഥലത്ത്
ആയിരിക്കും.
Observance spectroscopy ഡാറ്റ പോലെ
ക്രോമാറ്റോഗ്രാഫില്‍
നിന്ന് ആവൃത്തിയുടെ
ഒരു ഫങ്ഷനായിട്ടാണ്
പലപ്പോഴും ഡേറ്റാ
വരുന്നത്.
രണ്ടാമത്തേത്, ഒരു
തീരുമാനമെടുക്കാന്‍
നമ്മള്‍ നിര്‍ബന്ധിതമാവുന്നു.
അത് ഡൈമന്‍ഷണലിസം
കുറയ്ക്കലാണ്.
പ്രത്യേകിച്ച് നമ്മള്‍
വലിയ അളവിലുള്ള ഡാറ്റയെ
നോക്കുമ്പോള്‍ അത്
ഇപ്പോള്‍ പൊതുവായിത്തീരുന്നു.
വലിയ അളവിലുള്ള മള്‍ട്ടി
വേരിയബിള്‍ ഡാറ്റ
വിശകലനം ചെയ്യാന്‍
സാധ്യമല്ല.
പ്രത്യേകിച്ച് നൂറ്
കണക്കിന് ആയിരക്കണക്കിന്
ഡാറ്റ ഉണ്ടെങ്കില്‍,
ഇന്ന് അത് സാധാരണമാണ്.
ഇക്കാര്യത്തില്‍
മെഷിന്‍ ലേണിംഗ്
അല്‍ഗോരിതം വളരെ
ഫലപ്രദമാണ്.
പ്രിന്‍സിപ്പല്‍
കംപോണന്‍റ് അനാലിസിസ്,
നോണ്‍-നെഗറ്റീവ്
മെട്രിക്സ് ഫാക്റ്ററൈസേഷന്‍,
കൂടാതെ അതുപോലുള്ള
റിഡക്ഷന്‍ ടെക്നിക്കുകള്‍
എന്നിവയും ഇന്ന്
വലിയ അളവിലുള്ള ഡാറ്റ
വിശകലനം ചെയ്യുന്നതില്‍
വളരെ ശക്തമാണ്.

Bengali: 
পারেন।
উদাহরণস্বরূপ, যদি
আমি পর্যায়কালীন
সনাক্তকরণের দিকে
তাকিয়ে থাকি, তবে
প্রথমে আমি একটি
নির্ধারিত সংজ্ঞায়িত
সংকেতটি সংজ্ঞায়িত
করতে হবে।
যদি আমি নির্ণায়ক
তথ্য দেখতে পাচ্ছি,
এবং যদি আমি স্টোরেচিকাল
ডেটা দেখতে পাচ্ছি,
তাহলে আমাকে নির্দিষ্ট
সময়সীমার র্যান্ডম
প্রক্রিয়া দ্বারা
বোঝানো হবে।
তাই, সংজ্ঞা ভিন্নতা,
এবং তাই অধিকার, ব্যাখ্যা
এছাড়াও পরিবর্তন
করা হবে।
অনুরূপভাবে, যখন
আমি একটি স্টোকাস্টিক
সংকেত গড়ের কথা
উল্লেখ করছি, তখন
সাধারণত ভুল ধারণা
হল নমুনা মানে, যা
পর্যবেক্ষণ থেকে
গণনা করা মানেটি
প্রক্রিয়াটির গড়
হিসাবে বিবেচিত হয়;

Kannada: 
ಮತ್ತು ಅದು ತುಂಬಾ
ದೊಡ್ಡದಾದರೆ, ಅಂದಾಜು
ಅಥವಾ ಅಂದಾಜಿನ ಪ್ರಕಾರ
ದೊಡ್ಡ ವ್ಯತ್ಯಾಸವಿದೆ
ಎಂದು ನಾವು ಹೇಳುತ್ತೇವೆ.
ಈ ಕಾರಣಕ್ಕಾಗಿ, ವ್ಯತ್ಯಾಸವನ್ನು
ನಿಖರವಾಗಿ ಸೂಚಿಸಲಾಗುತ್ತದೆ.
ಅಂದಾಜುಗಿಂತ ಕಡಿಮೆ
ವ್ಯತ್ಯಾಸವೆಂದರೆ,
ಅಂದಾಜುದಾರರು ಹೆಚ್ಚು
ನಿಖರವಾದರು.
ಇದಕ್ಕೆ ವಿರುದ್ಧವಾಗಿ,
ಪಕ್ಷಪಾತವು ನಿಖರತೆಗಳನ್ನು
ಅಳೆಯುತ್ತದೆ.
ಪಕ್ಷಪಾತ ಕಡಿಮೆ, ಕಡಿಮೆ
ನಿಖರತೆ.
ವಾಸ್ತವವಾಗಿ, ಶೂನ್ಯ
ಪಕ್ಷಪಾತ ಅರ್ಥ, ಇದು
ನಿಖರವಾಗಿದೆ; ಅಂದಾಜುದಾರನು
ನಿಖರವಾದ ಒಂದು ಸತ್ಯವನ್ನು
ನಿಮಗೆ ನಿಖರವಾದ ಅಂದಾಜು
ನೀಡುತ್ತದೆ.
ವಿಶಿಷ್ಟವಾಗಿ, ನಾವು
ವ್ಯತ್ಯಾಸದ ಬಗ್ಗೆ
ಹೆಚ್ಚು ಚಿಂತಿತರಾಗಿದ್ದೇವೆ.
ಹೌದು, ನಿಸ್ಸಂಶಯವಾಗಿ
ನಮಗೆ ನಿಖರವಾದ ಅಂದಾಜು
ಬೇಕು; ಆದರ್ಶಪ್ರಾಯವಾಗಿ,
ನಾವು ನಿಖರವಾದ ಮತ್ತು
ನಿಖರವಾದ ಅಂದಾಜಿನಂತೆ
ಬಯಸುತ್ತೇವೆ.
ಸೀಮಿತ ಮಾದರಿಗಳಿಂದ
ನಿಖರವಾದ ಮತ್ತು ನಿಖರವಾದ

Hindi: 
और सबसे महत्वपूर्ण
बात यह है कि सही गणितीय
या सांख्यिकीय उपकरण
चुनना है।
उदाहरण के लिए, यदि
मैं माध्य का आकलन
करना चाहता हूं, तो
मैं अनुमानक के रूप
में माध्य, नमूना
माध्य या नमूना औसत
चुन सकता हूं।
अब, मुझे अनुमानक
के रूप में नमूना
मतलब कब चुनना चाहिए,
मुझे नमूना औसत चुनना
चाहिए - इसके लिए कोई
सही जवाब नहीं है,
लेकिन कुछ बहुत अच्छे
दिशानिर्देश हैं।
अगर मुझे पता है कि
डेटा आउटलाइर्स से
मुक्त है और यह गॉसियन
वितरित प्रक्रिया
से बाहर आ रहा है,
नमूना मतलब आपको
सबसे कुशल अनुमानक
देता है - जिसका अर्थ
है सभी अनुमानकों
के बीच सबसे कम संभव
त्रुटि का अनुमान;
लेकिन अगर मुझे लगता
है कि डेटा आउटलाइनर्स
के साथ सही किया जा
सकता है और मैं नहीं
चाहता कि मेरा अनुमानक
इससे प्रभावित हो,
तो नमूना मतलब मजबूत
नहीं है।
इसका मतलब है कि यह
बहुत संवेदनशील बहिर्वाहक
है, तो मुझे नमूना
औसत का उपयोग करना
चाहिए।
यह मेरे पूर्व ज्ञान
विश्लेषण चरण से
पहले और मेरे द्वारा
प्राप्त ज्ञान पर

Tamil: 
டொமைன் பகுப்பாய்வு
(frequency domain analysis) என்பது
மிக நுட்பமான பகுப்பு
பகுப்பாய்வாகும்,
ஏனெனில் அதிர்வுத்
தன்மை, ஈசிஜி (ECG) அல்லது
ஈஈஜி (EEG) தரவுகளிலிருந்து
வருகின்ற தரவுகளையோ,
வளிமண்டல தரவுகளையோ
அல்லது டேட்டா (Data)களையோ
பார்த்தால் செயல்முறை.
நிச்சயமாக, பல முறை
நீங்கள் கூட்டு நேர
அதிர்வெண் டொமைன்
அனாலிசிஸ் (frequency domain
analysis) செய்ய வேண்டும்.
வேவ்லெட்டு (Wavelets)
அவற்றில் ஒன்று.
எனவே, அனாலிசிஸ்
டொமைன் (analysis domain) தேர்வு
மற்றும் நேரம் இருக்க
வேண்டும், அது கூட
விண்வெளியில் இருக்க
முடியும்.
அநேக தடவை தரவு நீங்கள்
நேரடியாக அதிர்வெண்
செயல்பாட்டிற்கு
வரலாம், கடைபிடித்தல்
ஸ்பெக்ட்ரோஸ்கோபி
டேட்டா (Spectroscopy Data) க்ரோமோடோகிராபியிலிருந்து
(chromography) அதிர்வெண்
செயல்பாட்டாக வருகிறது.
நாம் ஒரு முடிவு
எடுக்க வேண்டும்
என்று இரண்டாவது
பின்னர் டைமென்ஷனாலிட்டி
(dimensionality) குறைப்பு
மற்றும் நாம் பெரிய
பரிமாண டேட்டா (Data)
பார்த்து போது குறிப்பாக.
இது இப்போது பொதுவானதாகி
வருகிறது.
பெருமளவிலான தரவுகளை
பெரிய டைமென்ஷனாலிட்டி
(dimensionality)ல் பகுப்பாய்வு
செய்வது சாத்தியமில்லை,
குறிப்பாக நூற்றுக்கணக்கான
மற்றும் ஆயிரக்கணக்கானோருக்கு
செல்லும் போது, ​​அவை
இன்று மிகவும் பொதுவானவை.
மற்றும் இயந்திர
கற்றல் வழிமுறைகள்
இந்த விஷயத்தில்
மிகவும் எளிது.
முதன்மை கூறு பகுப்பாய்வு,
அல்லாத எதிர்மறை
அணி காரணிப்படுத்தல்,
மற்றும் பல பரிமாண
குறைப்பு நுட்பங்கள்
பெரிய பரிமாண தரவு,

English: 
data, large dimensional data. So, we have
to take a decision whether to analyze in the
dimensions that in which I have obtained or
in a reduced order or a lower order dimension.
And most importantly is to choose a right
mathematical or statistical tool. For example,
if I want to estimate the mean, I can choose
mean, sample mean or sample median as an estimator.
Now, when should I choose sample mean as an
estimator, when should I choose sample median
- there is no perfect answer for it, but there
are some very good guidelines. If I know that
the data is free of outliers and it’s coming
out of a Gaussian distributed process, sample
mean gives you the most efficient estimator
- meaning estimate to the lowest possible
error among all the estimators; but if I note
that the data could be corrected with outliers
and I don’t want my estimator to be affected
by it, then sample mean is not robust. That
means it’s very sensitive outliers, then
I should use the sample median. This depends

Gujarati: 
શોધમાં, સામાન્ય
નમૂના પર હાજર માહિતી.
અને તે સામાન્ય રીતે
દોષની તપાસને સર્વત્ર

Malayalam: 
അതിനാല്‍, ഞാന്‍
നേടിയെടുത്തതോ കുറവുള്ള
ഓര്‍ഡറിലോ ഒരു താഴ്ന്ന
ഓര്‍ഡറില്‍ നിന്നോ
ഉള്ള അളവുകളില്‍
വിശകലനം ചെയ്യണമോ
വേണ്ടയോ എന്ന് നിങ്ങള്‍
തീരുമാനിക്കേണ്ടതുണ്ട്.
ഏറ്റവും പ്രധാനമായി
ശരിയായ ഗണിതമോ സ്റ്റാറ്റിസ്റ്റിക്കല്‍
ഉപകരണമോ തിരഞ്ഞെടുക്കണം.
ഉദാഹരണത്തിന്, ഞാന്‍
ഒരു ശരാശരി കണക്കാക്കാന്‍
ആഗ്രഹിക്കുന്നുവെങ്കില്‍
എനിക്ക് ശരാശരി സാമ്പിള്‍
mean അല്ലെങ്കില്‍
സാമ്പിള്‍ മീഡിയനോ
എസ്റ്റിമേറ്ററായി
തിരഞ്ഞെടുക്കാം.
ഇപ്പോള്‍ ഒരു എസ്റ്റിമേറ്റര്‍
എന്ന നിലയില്‍ സാമ്പിള്‍
median തെരഞ്ഞെടുക്കുക.
ഇതിന് കൃത്യമായ ഉത്തരം
ഇല്ല, എന്നാല്‍ ചില
നല്ല മാര്‍ഗ്ഗരേഖകള്‍
ഉണ്ട്.
ഡാറ്റ outliers നിന്ന്
വരുന്നതാണെന്ന്
നിങ്ങള്‍ മനസ്സിലാക്കുന്നുവെങ്കില്‍,
നിങ്ങള്‍ക്ക് ഏറ്റവും
മൂല്യമേറിയ കണക്ക്
സാമ്പിള്‍ mean നല്കും.
എല്ലാ എസ്റ്റിമേറ്റുകളുടെയും
ഏറ്റവും കുറഞ്ഞ പിഴവുകള്‍ക്ക്
ആ എസ്റ്റിമേറ്റ്
കാരണമാകുന്നു.
എന്നാല്‍ ഡാറ്റ outliers
നിന്ന് പരിഹരിക്കപ്പെടുമെന്ന്
ഞാന്‍ ശ്രദ്ധിക്കപ്പെടുന്നുണ്ടെങ്കില്‍,
എന്‍റെ മൂല്യനിര്‍ണ്ണയത്തിന്

Marathi: 
निवड करावी, मी साध्या
मध्यकांची निवड केव्हा
करावी - त्याच्यासाठी
एकही ठराविक उत्तर
नाही, परंतु काही
फार चांगले मार्गदर्शक
तत्त्वे आहेत. जर
मला माहिती आहे की
डेटा मुक्त आहे आणि
तो गौशियन (gausian) वितरीत
प्रक्रियेतून येत
आहे, तर नमूना म्हणजे
आपल्याला सर्वात
प्रभावी अंदाजपत्रक
- सर्व अंदाजकांमधे
सर्वात कमी संभाव्य
त्रुटीबद्दल अंदाज;
परंतु जर मला लक्षात
आले की डेटा आउटलाइअर
बरोबर दुरुस्त करता
येतो आणि मला माझ्या
अंदाजाप्रकरणाचा
परिणाम होऊ नये असे
वाटत असेल तर, नमूना
अर्थ म्हणजे मजबूत
नाही. याचा अर्थ असा
की हे अतिशय संवेदनशील
आऊट लायर (outliers) आहे,
नंतर मी नमुना मध्यक
वापर पाहिजे.
हे माझ्या अगोदरच्या
ज्ञानावर आधारित
आहे आणि माझ्या प्राथमिक
माहिती विश्लेषणातून
मिळालेल्या माहितीवर
ते अवलंबून आहे. आणि
या प्रकारचे निर्णय
प्रत्येक टप्प्यावर
केले पाहिजेत आणि
तेथे अद्वितीय उत्तर
असू शकत नाही. लक्षात
ठेवा; डेटा विश्लेषणात,

Kannada: 
ಅಂದಾಜುಗಳನ್ನು ಪಡೆಯುವುದು
ಸಾಧ್ಯವಿಲ್ಲ, ಆದರೆ
ಸಾಧ್ಯವಾದರೆ ಕಡಿಮೆ
ಪಕ್ಷಪಾತ ಅಥವಾ ಶೂನ್ಯ
ಪಕ್ಷಪಾತವು ಸಾಧ್ಯವಾದಷ್ಟು
ಮತ್ತು ಕಡಿಮೆ ಅಥವಾ
ಕಡಿಮೆ ದೋಷ ಎಂದು ನಾವು
ಖಂಡಿತವಾಗಿ ಬಯಸುತ್ತೇವೆ.
ಅದಕ್ಕಾಗಿಯೇ ನೀವು
ಪ್ರಯೋಗಾಲಯಗಳಿಗೆ
ಸರಬರಾಜು ಮಾಡುತ್ತಿರುವ
ಅನೇಕ ವಾದ್ಯಗಳ ಮೇಲೆ
ನೋಡಿದರೆ, ನೀವು ಈ ವಾದ್ಯಗಳನ್ನು
ಹೆಚ್ಚು ನಿಖರವಾದ ಸಾಧನವಾಗಿ
ಅರ್ಹತೆ ಹೊಂದಿದ್ದೀರಿ.
ನೆನಪಿಡಿ, ಅಂದಾಜು
ನಾವು ದತ್ತಾಂಶದ ಮೇಲೆ
ಗಣಿತ ಸೂತ್ರವನ್ನು
ಬಳಸುವುದರ ಬಗ್ಗೆ ಅಲ್ಲ.
ವಾಸ್ತವವಾಗಿ ಸಂವೇದಕ
ಕೂಡ, ಅದು ನಿಮಗೆ ಕೊಡುವ
ಓದುವಿಕೆ ಸತ್ಯದ ಅಂದಾಜುಯಾಗಿದೆ.
ಆದ್ದರಿಂದ, ಒಬ್ಬರು
ತುಂಬಾ ವಿಶಾಲವಾದ ನೋಟವನ್ನು
ಹೊಂದಿರಬೇಕು.

Marathi: 
आपल्या विश्लेषणाच्या
प्रत्येक टप्प्यावर
अनिवार्यपणे कोणतेही
विशेष उत्तर नसते
आणि अगदी शेवटपर्यंत
देखील, जेव्हा आपण
एखादे मॉडेल तयार
करता, तेव्हा देखील
अनेक मॉडेल असू शकतात
जे दिलेल्या डेटा
समजावून सांगू शकतात
आणि आपल्याला प्रत्यक्षात
या मॉडेलवर आधारित
काही निकषांवर आणि
त्याचप्रमाणे, गृहितक
चाचणीमध्ये, आम्हाला
योग्य सांख्यिकी
आणि विचलनाचे विश्लेषण
करणे आवश्यक आहे.
आपल्याला प्रथम परिवर्तनशीलतेचे
स्रोत काय आहेत हे
जाणून घ्यावे लागेल;
कमीत कमी प्रामाणिकपणे
चांगले अंदाज किंवा
मॉडेलिंग मध्ये मी
म्हणेन की आपल्याला
योग्य रिग्रेसॉर
सेट आणि मॉडेल रचना
निवडायची असेल आणि
नेहमीच आणि पूर्वी
किंवा / किंवा डोमेन
ज्ञानामध्ये फॅक्टर.
आपण कदाचित एखाद्या
प्राध्यापिकेची
माहिती घेऊ शकता,
भौतिकी किंवा प्रक्रियेशी
संबंधित नसल्यास,
परंतु सेन्सर लक्षणांवरून
आणि असेच होऊ शकते,
आणि अर्थातच, आपण
डोमेन किंवा भौतिकशास्त्र
किंवा केमिस्ट्री
किंवा जीवशास्त्र
याबद्दलची काही माहिती
असू शकता. प्रक्रिया
करा ज्यामुळे आपण

Hindi: 
निर्भर करता है।
और इस तरह के निर्णयों
को हर स्तर पर बनाया
जाना चाहिए और अद्वितीय
जवाब नहीं हो सकता
है।
उसे याद रखो; डेटा
विश्लेषण (DATA ANALYSIS)में,
आपके विश्लेषण के
हर चरण में और यहां
तक ​​कि अंत तक भी
कोई अनूठा उत्तर
नहीं है, यहां तक ​​कि
जब आप कोई मॉडल बनाते
हैं, तब भी कई मॉडल
हो सकते हैं जो दिए
गए डेटा को समझा सकते
हैं और आपको वास्तव
में मॉडल आधारित
होना पड़ सकता है
कुछ मानदंडों पर।
और इसी तरह, परिकल्पना
परीक्षण में, हमें
एक उचित सांख्यिकीय
और भिन्नता का विश्लेषण
करना होगा।
हमें पहले पता होना
चाहिए कि परिवर्तनशीलता
के स्रोत क्या हैं;
कम से कम पर्याप्त
रूप से पर्याप्त
या मॉडलिंग में अनुमान
लगाएं जैसा कि मैंने
कहा था कि आपको सही
रजिस्ट्रार सेट और
मॉडल संरचना का चयन
करना पड़ सकता है
और इसी तरह, और हमेशा
पूर्व और / या डोमेन
ज्ञान में कारक होना
चाहिए।
आप किसी प्राथमिकता
को जान सकते हैं, जो
आवश्यक रूप से भौतिकी
या प्रक्रिया से

Malayalam: 
അത് ബാധിക്കാതിരിക്കാന്‍
എനിക്ക് താല്പര്യമില്ലെങ്കില്‍,
മാതൃകാ ശരാശരി ഉറപ്പില്ല.
അത് വളരെ സെന്‍സിറ്റീവ്
outliers ആണ്. പിന്നെ ഞാന്‍
സാമ്പിള്‍ മീഡിയന്‍
ഉപയോഗിക്കണം.
എന്‍റെ പ്രാഥമികവിവരവിശകലനഘട്ടത്തില്‍
നിന്നും ഞാന്‍ നേടിയ
അറിവും മുമ്പുള്ള
അറിവും ഇത് ആശ്രയിച്ചിരിക്കും.
ഓരോ ഘട്ടത്തിലും
ഇത്തരം തീരുമാനങ്ങള്‍
എടുക്കേണ്ടതുണ്ട്.
അതുല്യമായ ഉത്തരങ്ങള്‍
അവിടെ ഉണ്ടാവണമെന്നില്ല.
ഓര്‍ക്കുക, നിങ്ങളുടെ
വിശകലനത്തിന്‍റെ
ഓരോ ഘട്ടത്തിലും
ഒരു പ്രത്യേക ഉത്തരം
നിങ്ങള്‍ക്ക് ഉണ്ടായിരിക്കില്ല.
നിങ്ങള്‍ ഒരു മോഡല്‍
സൃഷ്ടിക്കുമ്പോള്‍
പോലും, തന്നിരിക്കുന്ന
ഡാറ്റ വിശദീകരിക്കാന്‍
കഴിയുന്ന നിരവധി
മോഡലുകള്‍ ഉണ്ടായിരിക്കാം.
നിങ്ങള്‍ യഥാര്‍ത്ഥത്തില്‍
മോഡല്‍ തെരഞ്ഞെടുക്കുമ്പോള്‍
ചില മാനദണ്ഡങ്ങളില്‍
അടിസ്ഥാനമാക്കിയുള്ളതായിരിക്കണം.
അതുപോലെതന്നെ, പരികല്പന
പരിശോധനയില്‍ അനുയോജ്യമായ
ഒരു സ്റ്റാറ്റിസ്റ്റിക്സും
variance വിശകലനവും തിരഞ്ഞെടുക്കേണ്ടതുണ്ട്.
Variance ഉറവിടങ്ങള്‍
എന്താണെന്ന് ആദ്യം
നാം മനസ്സിലാക്കണം.
ശരിയായി ഊഹിക്കുകയോ
അല്ലെങ്കില്‍ മോഡലിങ്ങില്‍
ഞാന്‍ ഊന്നിപ്പറയുന്നു.

English: 
on prior knowledge that I have and the knowledge
that I have acquired from my preliminary data
analysis step. And these kinds of decisions
have to be made at every stage and there may
not be unique answer.
Remember that; in data analysis, there is
no unique answer necessarily at every stage
of your analysis and even towards the end,
even when you build a model, there may be
many models that can explain the given data
and you may have to actually pick the model
based on some criteria. And likewise, in hypothesis
test, we have to choose an appropriate statistic
and analysis of variance. We may have to first
know what the sources of variability are;
at least guess fairly well enough or in modeling
as I said you may have to choose the right
regressor set and model structure and so on,
and always factor in prior and/or domain knowledge.
You may know a priori something, not necessarily
related to the physics or the process, but
may be from the sensor characteristics and

Tamil: 
ஆய்வு செய்ய மிகவும்
சக்தி வாய்ந்தவை.
ஆகையால், நான் பெற்றுள்ள
அல்லது பரிமாற்றத்தில்
அல்லது குறைந்த வரிசையில்
டைமென்ஷனாலிட்டி
(dimensionality) ஆய்வு செய்யலாமா
என்பதை தீர்மானிக்க
வேண்டும்.
மிக முக்கியமாக சரியான
கணித அல்லது ஸ்டாடிக்ஸ்
(statics) கருவிகளை தேர்வு
செய்ய வேண்டும்.
உதாரணமாக, நான் சராசரி
மதிப்பீடு செய்ய
விரும்பினால், ஒரு
மதிப்பீட்டாளராக
சராசரி, மாதிரி சராசரி
அல்லது மாதிரியை
மாதிரி தேர்வு செய்யலாம்.
இப்போது, ​​நான்
ஒரு மதிப்பீட்டாளராக
மாதிரியை தேர்வு
செய்வது எப்போது,
​​நான் மாதிரி இடைக்காலத்தை
தேர்வு செய்ய வேண்டும்
- அதற்கு எந்த சரியான
பதிலும் இல்லை, ஆனால்
சில நல்ல வழிமுறைகள்
உள்ளன.
தரவு தரமுடியாததாக
இருப்பதையும், அது
ஒரு காஸியன் (gaussian)
விநியோகிக்கப்பட்ட
செயல்முறையிலிருந்து
வெளியே வருவதாகவும்
எனக்குத் தெரியும்
என்றால், மாதிரி
அர்த்தம் மிகச் சிறந்த
மதிப்பீட்டாளரை
உங்களுக்கு வழங்குகிறது
- அதாவது அனைத்து
மதிப்பீட்டாளர்களிடமும்
மிகக் குறைவான பிழை
ஏற்படுவதற்கான மதிப்பீடு;
ஆனால் தரவு தரவரிசைகளை
சரிசெய்ய முடியும்
என்பதை நான் கவனித்தால்,
என் மதிப்பீட்டாளரால்
அது பாதிக்கப்பட
வேண்டும் என்று விரும்பவில்லை
என்றால், மாதிரி
அர்த்தம் வலுவானது
அல்ல. அதாவது, அது
மிகுந்த உணர்ச்சிவசப்படுபவர்களிடமிருந்து
வருகிறது, பின்னர்
நான் மாதிரியைப்
பயன்படுத்த வேண்டும்.
இது எனது முந்தைய
தரவு பகுப்பாய்வு
படிப்பிலிருந்து
நான் பெற்ற அறிவைப்
பற்றியும் அறிவையும்
சார்ந்துள்ளது.

Gujarati: 
હાથ ધરવામાં આવે
છે; પ્રક્રિયા ઉદ્યોગમાં
પણ તે પરિસ્થિતિ
છે. તેથી, આ પ્રક્રિયા
મોનીટરીંગ તરીકે
પણ ઓળખાય છે. અને કેટલાક

Bengali: 
যে, এটি সব সময়ে সত্য
নয়।
নমুনা অর্থ শুধুমাত্র
একটি অর্থপূর্ণ অর্থের
একটি অনুমান যা ভিন্ন
ভাবে সংজ্ঞায়িত
করা হয় এবং আমরা
তা দ্রুত নিয়ে আলোচনা
করব।
সুতরাং, এখানে নিচের
লাইনটি হল, আপনি যদি
গড় রূপ বা সংকেতের
অন্য কোন চরিত্রের
দিকে তাকিয়ে থাকেন
তবে আপনি সত্যিই
বইগুলিতে ফিরে যাবেন
এবং জিজ্ঞাসা করুন
যে আমি যে সংকেতটি
দেখছি তা
কীভাবে ব্যাখ্যা
করা হয়েছে।
যদি আমি একটি নির্ণয়বিজ্ঞানী
সংকেত দেখি - তাহলে
পর্যায়কালীনতার
সংজ্ঞা কি?
মানে কি সংজ্ঞা?
যদি আমি স্টচাস্টিক
সংকেত দেখি - তাহলে
সংজ্ঞা কি?

Hindi: 
संबंधित नहीं है,
लेकिन सेंसर विशेषताओं
से हो सकता है, और
निश्चित रूप से, आप
डोमेन या भौतिकी
या रसायन शास्त्र
या जीवविज्ञान के
बारे में कुछ जान
सकते हैं प्रक्रिया
है कि आप आसानी से
कई सिरदर्द में कारक
और बचा सकते हैं।
और आखिरकार, जब आप
अपने सभी विश्लेषण
के साथ कर लेंगे, तो
यह सबसे महत्वपूर्ण
हिस्सा है - यह आकलन
करना कि आपने क्या
परिणाम प्राप्त किए
हैं और उन्हें रिपोर्ट
करना एक बहुत ही महत्वपूर्ण
कदम है।
हमेशा किसी भी पैरामीटर
का विषय लें, एक परिकल्पना
'परीक्षण का अनुमान
लगाएं - चाहे वह पर्याप्त
महत्वपूर्ण हो, चाहे
आपने मौके से गैर-शून्य
मूल्य प्राप्त किया
हो, भले ही आपको शून्य
प्राप्त हो।
तो, आपको पैरामीटर
की परिकल्पना परीक्षण
शून्य होना चाहिए
- यह शून्य परिकल्पना
है, और फिर, सांख्यिकीय
रूप से अच्छी तरह
से चलती है।
और दूसरी बात, अनुमानों
में आत्मविश्वास
क्षेत्रों और त्रुटियों
की रिपोर्ट करें।
वास्तव में, आत्मविश्वास
क्षेत्रों और त्रुटियों
की गणना आपके परिकल्पना
परीक्षण का एक अभिन्न
हिस्सा हैं।
और फिर, यदि आप मॉडल
बना रहे हैं, तो मॉडल

Tamil: 
ஒவ்வொரு கட்டத்திலும்
இந்த வகையான முடிவுகள்
எடுக்கப்பட வேண்டும்,
அங்கே தனிப்பட்ட
பதில் இல்லை.
அதை நினைவில் கொள்;
தரவு பகுப்பாய்வில்,
உங்கள் பகுப்பாய்வின்
ஒவ்வொரு கட்டத்திலும்,
முடிவில்லாமல், நீங்கள்
ஒரு மாடலை உருவாக்கும்போதும்
கூட, தனிப்பட்ட பதில்களுக்கு
அவசியமில்லை, கொடுக்கப்பட்ட
தரவை விவரிக்கக்கூடிய
பல மாதிரிகள் இருக்கலாம்,
நீங்கள் அடிப்படையில்
மாதிரியை தேர்வு
செய்ய வேண்டும் சில
அடிப்படைகளில்.
அதேபோல், கருதுகோள்
சோதனை, நாம் ஒரு சரியான
புள்ளிவிவரம் மற்றும்
மாறுபாடு பகுப்பாய்வு
தேர்வு செய்ய வேண்டும்.
மாறுபாட்டின் ஆதாரங்கள்
என்னவென்று முதலில்
அறிந்திருக்க வேண்டும்;
குறைந்தது யூகிக்கிறேன்
போதும் அல்லது மாடலிங்
(modelling) செய்யலாம் என்று
நான் சொன்னது போல
சரியான பதிப்பக அமைப்பு
மற்றும் மாதிரி கட்டமைப்பை
தேர்வு செய்ய வேண்டும்,
மற்றும் எப்போதும்
முன் மற்றும் / அல்லது
டொமைன் (domain) அறிவு
உள்ள காரணி.
பிசிக்ஸ் (Physics) அல்லது
செயல்முறைக்கு அவசியம்
இல்லை, ஆனால் சென்சார்
(sensor) குணவியல்புகள்
மற்றும் பலவற்றில்
இருந்து இருக்கலாம்,
நிச்சயமாக, நீங்கள்
டொமைன் (domain) அல்லது
பிசிக்ஸ் (Physics)அல்லது
கெமிஸ்ட்ரி (chemistry)
பற்றியோ நீங்கள்
எளிதாக காரணி மற்றும்
செயல்முறை தலைவலி
நிறைய சேமிக்க முடியும்
.
கடைசியாக, நீங்கள்
உங்கள் அனாலிசிஸ்
(Analysis) முடிந்தவுடன்,
இது மிக முக்கியமான
பகுதியாகும் - நீங்கள்
எடுத்த முடிவு என்ன
என்பதை மதிப்பிடுவதன்

Marathi: 
खूप डोकेदुखी करू
शकता आणि खूप डोकेदुखी
वाचू शकता.
आणि शेवटी, एकदा आपण
आपल्या सर्व विश्लेषणासह
केले आहे, हे सर्वात
महत्त्वाचे भाग आहे
- आपण प्राप्त केलेले
परिणाम आणि त्यांचा
अहवाल देणे हे एक
अतिशय महत्त्वाचे
पाऊल आहे. नेहमी एखाद्या
परीक्षेचा अंदाज
लावा, एखाद्या अभिप्रायाची
चाचणी करा - तो हे
पुरेसे आहे की नाही,
आपण अचूकपणे शून्य-शून्य
मूल्य प्राप्त केले
आहे की नाही हे जरी
खरे असले तरी आपण
शून्य प्राप्त केले
पाहिजे तर, आपण पॅरामीटर
असण्याच्या अवघड
परीक्षणाचा विषय
घ्यावा - हे शून्य
अनुपालन आहे, आणि
नंतर, सांख्यिकदृष्ट्या
ध्वनी स्वरूपात चालवा.
आणि दुसरे म्हणजे,
आत्मविश्वास क्षेत्र
आणि अनुमानांमध्ये
त्रुटी सांगा.
खरं तर, आत्मविश्वास
क्षेत्रांचे गणित
करणे आणि त्रुटी
आपल्या अभिप्रायात्मक
चाचणीचा अविभाज्य
भाग आहेत. आणि मग,
आपण मॉडेल तयार करत
असल्यास, नंतर मॉडेल

Kannada: 
ಹಾಗಾಗಿ, ಕಂಪೆನಿ ಅಥವಾ
ಉತ್ಪಾದಕವು ಹೆಚ್ಚಿನ
ಮೆರವಣಿಗೆ ಸಾಧನದ ಮೂಲಕ
ಅರ್ಥೈಸಿಕೊಳ್ಳುವುದು,
ನೀವು ಸಂವೇದಕದಲ್ಲಿ
ಅದೇ ವೇರಿಯಬಲ್ ಅನ್ನು
ಪದೇಪದೇ ಅಳತೆ ಮಾಡಿದರೆ,
ನೀವು ಹೆಚ್ಚು ವ್ಯತ್ಯಾಸವನ್ನು
ಕಾಣುವುದಿಲ್ಲ.
ಖಂಡಿತವಾಗಿಯೂ ಕೆಲವು
ಭಿನ್ನತೆ ಇರುತ್ತದೆ.
ಆದ್ದರಿಂದ, ಥರ್ಮಾಮೀಟರ್
ತೆಗೆದುಕೊಂಡು ಅದನ್ನು
ನಿಮ್ಮ ದೇಹದಲ್ಲಿ ಇರಿಸಿ
ಮತ್ತು ಓದುವಿಕೆಯನ್ನು
ತೆಗೆದುಕೊಳ್ಳಿ.
ಓದುವಿಕೆಯನ್ನು ಗಮನಿಸಿ.
ನಂತರ ಮತ್ತೆ, ಥರ್ಮಾಮೀಟರ್
ತೆಗೆದುಕೊಳ್ಳಿ, ನಂತರ
ಅದನ್ನು ದೇಹದ ಅದೇ
ಭಾಗದಲ್ಲಿ ಇರಿಸಿ ಮತ್ತು
ಓದುವಿಕೆಯನ್ನು ತೆಗೆದುಕೊಳ್ಳಿ.
ಖಂಡಿತ, ನೀವು ಅದೇ ಓದುವಿಕೆಯನ್ನು
ಬಹುಶಃ ನೋಡುತ್ತಾರೆ,
ಏಕೆಂದರೆ ಥರ್ಮಾಮೀಟರ್ಗಳು
ಮೊದಲ ದಶಮಾಂಶಕ್ಕಿಂತಲೂ
ವರದಿ ಮಾಡುವುದಿಲ್ಲ,
ಆದರೆ ನೀವು ಥರ್ಮಾಮೀಟರ್ಗಳ
ವರದಿ ಮಾಡುವಿಕೆಯು
ನಾಲ್ಕನೇ ಅಥವಾ ಐದನೇ

Gujarati: 
હેતુઓ છે કે જે કોઈ
ડેટા એનાલિસિસ( data
analysis)માં સૂચિબદ્ધ
કરી શકે છે, પરંતુ
આ મુખ્યત્વે ડેટા
એનાલિસિસ( data analysis)ના
મોટા ભાગના કાર્યક્રમોને
આવરે છે. જેમ તમે જોઈ
શકો છો કે એપ્લિકેશન
ખૂબ જ વૈવિધ્યસભર
છે. તેથી, અમે એનાલિસિસ(analysis)
માટે જે પ્રક્રિયાને
અનુસરીએ છીએ તે સાધનો,
જે અમે ગોઠવીએ છીએ
અને જે અર્થઘટનો
અમે કરીએ છીએ તે ચોક્કસપણે
મોટે ભાગે અલગ અલગ
હોય છે.
તેથી, ડેટા એનાલિસિસ(data
analysis) ને જોવાનું અને
ડેટા આધારિત એનાલિસિસ(analysis)
ની વ્યાપક યોજનામાં,
તે ક્યાંથી ફિટ છે
તે પૂછવું ઉપયોગી
છે. તેથી, અહીં આ સચિત્ર
પ્રતિનિધિત્વ તમને
કેટલાક વિચારો આપવાનો
પ્રયાસ કરે છે કે
જ્યાં એનાલિસિસ(analysis)
સાઇન ઇન કરે છે. યોજનાની
ટોચ પર, તમારી પાસે
પ્રક્રિયા છે, અને
આ પ્રક્રિયા ખૂબ
જ સામાન્ય પ્રક્રિયા
છે; તે એક એન્જિનિયરિંગ
પ્રક્રિયા ન હોવી
જોઈએ; તે એક સામાજિક
પ્રક્રિયા અથવા જૈવિક
પ્રક્રિયા હોઈ શકે
છે. અને અમારી પાસે
સેન્સર્સ પ્રક્રિયામાંથી
માહિતી એકઠી કરે
છે અને આ સેન્સર(sensor)
માત્ર શાસ્ત્રીય
હાર્ડવેર અથવા ઇન્સ્ટ્રુમેન્ટેશન
સેન્સર(sensor)(instrumentation
sensors)ની જરૂર નથી. તે
માનવ સેન્સર(sensor) પણ
હોઇ શકે છે જ્યારે
અમે સર્વેક્ષણ ડેટા
એકત્રિત કરીએ છીએ,
ત્યારે અમે સેન્સર(sensor)
છીએ, હકીકતમાં.
અંતે, અમારી પાસે
ડેટા છે અને તે જ છે
જ્યાં પ્રક્રિયા
ડેટા એનાલિસિસ( data
analysis) થી શરૂ થાય છે.
આ મોડ્યુલમાં, અલબત્ત,
અમે ડેટા કેવી રીતે
એકત્રિત કરવો તે
વિશે વાત કરવા જઈ
રહ્યા નથી, નમૂનાની
તકનીકો અને તેથી
વધુ; અમે માહિતીનું
એનાલિસિસ(analysis) કરવા
માટે વધુ ચિંતિત

Bengali: 
এবং তারপর শুধুমাত্র,
আপনি অর্থপূর্ণ ব্যাখ্যা
করতে পারেন।
এবং একটি খুব, খুব
সাধারণ পরিস্থিতি
হল বিদ্যুৎ বর্ণালী
ঘনত্ব যা সময়কাল
সনাক্তকরণের জন্য
এবং তাই ব্যবহার
করা হয়।
যাইহোক, আমরা বিস্তারিতভাবে
এত না যেতে, কিন্তু
আপনি এই তথ্য মনে
রাখা উচিত, এবং প্রত্যেক
সময় আপনি তথ্য সংগ্রহ
এবং আপনি বসতে তথ্য
গুরুত্বপূর্ণ বিশদ
প্রশ্ন জিজ্ঞাসা
করতে বিশ্লেষণ, এবং
যারা প্রশ্ন হল - আমি
কি সম্পর্কে অনুমান
করছি তথ্য উৎপাদন
প্রক্রিয়া।
সুতরাং, আমরা যে পদ্ধতিটি
সাধারণত ডেটা বিশ্লেষণে
অনুসরণ করা হয় তা
শেখার দিকে অগ্রসর

English: 
so on, and of course, you may know something
about the domain or the physics or the chemistry
or the biology of the process that you can
easily factor in and save a lot of headaches.
And finally, once you are done with all your
analysis, this is the most important part
- assessing what results you have obtained
and reporting them is a very important step.
Always subject any parameter, estimate to
a hypothesis’ test - whether it is significant
enough, whether you have just obtained a non-zero
value by chance, whether truly you should
have obtained zero. So, you should subject
hypothesis test of the parameter being zero
– that’s null hypothesis, and then, carry
on in a statistically sound manner.
And secondly, report confidence regions and
errors in estimates. In fact, computing confidence

Malayalam: 
നിങ്ങള്‍ ശരിയായ
regressorഡൊമെയ്ന്‍ വിജ്ഞാനം
ഉണ്ടാകണം.
നിങ്ങള്‍ക്ക് ഒരു
ഊഹമുണ്ടായിരിക്കാം,
അത് ഒരു ഭൗതികശാസ്ത്രത്തിലോ
പ്രക്രിയയോ ബന്ധപ്പെട്ടതായിരിക്കില്ല,
അത് സെന്‍സറിന്‍റെ
സ്വഭാവസവിശേഷതകളുമായി
ബന്ധമുള്ളതായിരിക്കും.
അങ്ങനെയാണെങ്കില്‍
നിങ്ങള്‍ ഡൊമെയ്ന്‍,
ഭൗതികശാസ്ത്രം, രസതന്ത്രം,
അല്ലെങ്കില്‍ ജീവശാസ്ത്രം
അത് എളുപ്പത്തില്‍
ഘടകക്ഷമതയുള്ളതും
തലവേദന ധാരാളം കുറക്കാന്‍
കഴിയുന്നതുമാണ്.
ഇവയെല്ലാം അറിഞ്ഞിരിക്കണം.
ഒടുവില്‍, നിങ്ങളുടെ
വിശകലനങ്ങളെല്ലാം
പൂര്‍ത്തിയാക്കി
കഴിഞ്ഞാല്‍, ഇതാണ്
ഏറ്റവും പ്രധാനപ്പെട്ട
റിപ്പോര്‍ട്ട് ചെയ്യുകയും
ചെയ്യുക.
എല്ലായ്പ്പോഴും
ഒരു പരാമീറ്ററിനെ
ഉപയോഗിക്കുക.
അത് ഒരു hypothesis ടെസ്റ്റിനായി
കണക്കിലെടുക്കുക.
നിങ്ങള്‍ ഒരു പൂജ്യമല്ലാത്ത
മൂല്യം കിട്ടാം.
അത് null ഹൈപ്പോതിസിസ്
ആണ്. അത് സ്റ്റാറ്റിസ്റ്റിക്
രീതിയിലാണ് നടന്നത്.
രണ്ടാമതായി, വിശ്വാസ്യതയുള്ള
പ്രദേശങ്ങളും പിശകുകളും
കണക്കിലെടുക്കുക.
വാസ്തവത്തില്‍, വിശ്വാസയോഗ്യമായ
പ്രദേശങ്ങളും പിശകുകളും
നിങ്ങളുടെ ഹൈപറ്റീസിസ്
പരിശോധനയുടെ അവിഭാജ്യഘടകമാണ്
തുടര്‍ന്ന് നിങ്ങള്‍
മോഡലുകള്‍ നിര്‍മ്മിക്കുകയാണെങ്കില്‍,

Kannada: 
ದಶಮಾಂಶದಂತೆ ಇರಬಹುದು
ಮತ್ತು ನೀವು ನಿಜವಾದ
ವ್ಯತ್ಯಾಸವನ್ನು ನೋಡಬಹುದು.
ಇದನ್ನು ವಾದ್ಯಗಳ ರೆಸಲ್ಯೂಶನ್
ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ.
ಆದರೆ, ಹೇಗಾದರೂ, ಪಾಯಿಂಟ್
ಅದೇ ವೇರಿಯಬಲ್ ಪುನರಾವರ್ತಿತ
ಅಳತೆ ಖಂಡಿತವಾಗಿಯೂ
ನೀವು ವಿವಿಧ ವಾಚನಗೋಷ್ಠಿಗಳು
ನೀಡುತ್ತದೆ, ಆದರೆ
ನೀವು ಆ ವಾಚನಗೋಷ್ಠಿಗಳು
ವ್ಯಾಪಕ ವ್ಯತ್ಯಾಸಗಳು
ಬಯಸುವುದಿಲ್ಲ.
ಆದ್ದರಿಂದ, ನಿಮಗೆ
ಹೆಚ್ಚು ನಿಖರವಾದ ಸಲಕರಣೆ
ಬೇಕು. ಆದ್ದರಿಂದ, ಇದರೊಂದಿಗೆ
ನಾವು ಹತ್ತಿರದ ಪರಿಭಾಷೆ
ಅಥವಾ ಪ್ರಮುಖ ಪರಿಭಾಷೆಗೆ
ಬರುತ್ತೇವೆ.
ಸಹಜವಾಗಿ, ಅನೇಕ ಪರಿಭಾಷೆಗಳಿವೆ,
ಅವುಗಳು ಪರಿಚಿತವಾಗಿರುವಂತೆ
ಬಯಸುತ್ತವೆ, ಆದರೆ
ಅವು ಮೂಲಭೂತವಾದವುಗಳಾಗಿವೆ.
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಗೆ
ಅನುಸರಿಸಬೇಕಾದ ಕಾರ್ಯವಿಧಾನದೊಂದಿಗೆ
ನಾವು ಉಪನ್ಯಾಸವನ್ನು
ಮುಕ್ತಾಯಗೊಳಿಸುತ್ತೇವೆ,
ತದನಂತರ, R ನಲ್ಲಿ ಕೆಲವು
ಉದಾಹರಣೆಗಳ ಉದಾಹರಣೆಗಳನ್ನು
ಸರಿಸು.
ನೆನಪಿಡುವ ಪ್ರಮುಖ
ವಿಷಯವೆಂದರೆ ಎಲ್ಲಾ
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ವಿಧಾನಗಳು
ಪ್ರಕೃತಿಯಲ್ಲಿ ಪುನರಾವರ್ತನೆಯಾಗಿದೆ.
ಹಂತ 1, ಹಂತ 2, ಹಂತ 3, ಹಂತ
4, ಮುಗಿದಿದೆ ಎಂದು ನಿರೀಕ್ಷಿಸಬೇಡಿ.

Gujarati: 
છીએ. તેથી, એક વાર
મારી પાસે ડેટા હોય,
ખાસ કરીને હું તેને
અમુક ચોક્કસ પગલાંઓ
દ્વારા મૂકી દઉં
છું અને અમે આ અંગે
થોડીવાર પછી વાત
કરીશું.
આ યોજનાકીયનો ઉદ્દેશ્ય
એ તમને જણાવવું કે
એનાલિસિસ(analysis) કયા
સ્થળે સમાવિષ્ટ છે.
બે તબક્કાઓ કે જેને
તમે એનાલિસિસ(analysis)
શીર્ષક અહીં જુઓ
છો, તે આવશ્યક છે કે
ડેટા એનાલિસિસ( data
analysis)માં શું ચાલે
છે તે રજૂઆત છે. ઉદાહરણ
તરીકે, વિઝ્યુલાઇઝેશન
એનાલિસિસ(analysis)નો એક
ભાગ છે. જ્યારે તમે
કંઈક પ્લોટ કરો છો,
અને ડેટામાંથી કંઈક
અવલોકન કરવાનો પ્રયાસ
કરો, તે ડેટા એનાલિસિસ(
data analysis)નો એક ભાગ પણ
છે. તે ખૂબ મહત્વનો
ભાગ છે અથવા તમે પેરામીટર
અંદાજ હાથ ધરી શકો
છો કારણ કે મેં હમણાં
જ ચર્ચા કરી છે અથવા
તમે મોડેલ બનાવી
શકો છો છેવટે, આ માહિતીના
એનાલિસિસ(analysis)ના પરિણામ
આમાંના કેટલાક ખૂબ
જ વ્યાપક કાર્યક્રમોમાં
જાય છે કારણકે મેં
હમણાં જ સમજાવી છે;
તે પ્રક્રિયા મોનીટરીંગ
માટે હોઈ શકે છે; તે
દોષ તપાસ છે અથવા
તે પ્રક્રિયા નિયંત્રણ
માટે હોઈ શકે છે, જ્યાં
હું માપન પર આધારિત
પ્રતિક્રિયા કાર્યવાહી
કરી રહ્યો છું. તેથી,
નિયંત્રક ડેટા લઈ
રહ્યું છે, કેટલાક
પ્રકારનું એનાલિસિસ(analysis)
કરી રહ્યું છે, અને
પછી, નક્કી કરવું
કે કેવી રીતે ઇનપુટ
થવું જોઈએ. તે ડેટા
એનાલિસિસ( data analysis) અથવા
ઑપ્ટિમાઇઝેશન(optimization)ના
કાર્યક્રમોનો એક
ભાગ પણ છે, હું પ્રક્રિયા
ચલાવવા માટે, અથવા
પ્રક્રિયામાં નવીનીકરણ
અથવા ફેરફારો કરવાના
ઑપ્ટિમાઇઝ(optimiz) રીત
સાથે આવવા પ્રયાસ
કરી રહ્યો છું. પછી,
અલબત્ત, ત્યાં કેટલાક
અન્ય એપ્લિકેશન્સ
છે કે જે મેં અહીં
સૂચિબદ્ધ કર્યા નથી,
પરંતુ આખરે તમારે
સમજી લેવું જોઈએ
કે ડેટા એનાલિસિસ(
data analysis) એ રસ્તાનો અંત
નથી, પરંતુ તે ખરેખર
ડેટા આધારિત પ્રક્રિયા,
એનાલિસિસ(analysis) પ્રક્રિયાની
એક અત્યંત જટિલ કલા
છે કામગીરી અને તેથી
પર; અને જ્યારે હું
અહીં પ્રક્રિયા કહું
છું, જેમ મેં અગાઉ
ઉલ્લેખ કર્યું છે,
તેના સામાન્ય રીતે
સામાન્ય છે. અને આ
બધામાં, અલબત્ત, ડોમેન(domain)
જ્ઞાન ખૂબ જ અગત્યનું
છે, જેમ હું અહીં પ્રકાશિત
કરું છું, અને અમે
થોડોક પછી આ વિશે

English: 
regions and errors are an integral part of
your hypothesis test. And then, if you are
building models, then cross validate models.
When I say models here, need not be regression
models, it could be classifiers also. And
if multiple models are identified, use a mix
of criteria; as I just mentioned earlier,
there may not be unique answer; typically,
that is the case. My students always ask me,
well I have two or three models explaining
the data, which one should I pick? Well, the
first thing is to make sure that you followed
a very systematic procedure to minimize the
number of solutions that you have and even
despite the best of efforts you may end up
with multiple solutions, very common. Then
you apply what are known as information theoretic
measures such as Akaike information criteria
or Bayesinformation criteria. And also keep
the end use of the model; may be your model
has to be implemented online; so, simple model
is preferred to a complicated one with a bit

Hindi: 
को मान्य करें।
जब मैं यहां मॉडल
कहता हूं, तो रिग्रेशन
मॉडल नहीं होना चाहिए,
यह क्लासिफायर भी
हो सकता है।
और यदि एकाधिक मॉडल
की पहचान की जाती
है, तो मानदंडों का
मिश्रण उपयोग करें;
जैसा कि मैंने पहले
उल्लेख किया था, अद्वितीय
जवाब नहीं हो सकता
है; आमतौर पर, यह मामला
है।
मेरे छात्र हमेशा
मुझसे पूछते हैं,
ठीक है मेरे पास डेटा
को समझाते हुए दो
या तीन मॉडल हैं, जिन्हें
मुझे चुनना चाहिए?
खैर, पहली बात यह सुनिश्चित
करना है कि आपने अपने
समाधानों की संख्या
को कम करने के लिए
एक बहुत ही व्यवस्थित
प्रक्रिया का पालन
किया है और यहां तक
​​कि कई समाधानों
के साथ आप कई समाधानों
के साथ समाप्त होने
के बावजूद भी बहुत
आम हैं।
फिर आप आवेदन करते
हैं जो सूचना सैद्धांतिक
(THEORETICAL) उपायों जैसे
अक्काइक सूचना मानदंड
या बेयसिनोफॉर्मेशन
मानदंड के रूप में
जाना जाता है।
और मॉडल का अंतिम
उपयोग भी रखें; हो
सकता है कि आपका मॉडल
ऑनलाइन लागू किया
जाए; इसलिए, भविष्यवाणी
की सटीकता पर कुछ

Malayalam: 
മോഡലുകള്‍ ക്രോസ്
മൂല്യനിര്‍ണ്ണയം
ചെയ്യുക.
ഞാന്‍ ഇവിടെ മോഡലുകളുണ്ടെന്ന്
പറഞ്ഞാല്‍, റിഗ്രഷന്‍
മോഡലുകള്‍ പാടില്ല.അത്
ക്ലാസിഫയര്‍ ആയിരിക്കും.
ഒന്നിലധികം മോഡലുകള്‍
കണ്ടെത്തുകയാണെങ്കില്‍,
മാനദണ്ഡങ്ങളുടെ
ഒരു മിശ്രിതം ഉപയോഗിക്കുക;
ഞാന്‍ നേരത്തെ സൂചിപ്പിച്ച
പോലെ, അതുല്യമായ
ഉത്തരം ഉണ്ടാകാനിടയില്ല.
സാധാരണയായി, അതാണ്
സ്ഥിതി.
എന്‍റെ വിദ്യാര്‍ത്ഥികള്‍
എപ്പോഴും എന്നോട്
ചോദിക്കുന്നു.
ഡാറ്റ എനിക്ക് വിശദീകരിക്കാന്‍
രണ്ടോ മൂന്നോ മോഡലുകളുണ്ടെങ്കില്‍
ഏത് നാം തെരഞ്ഞെടുക്കണം.
ഒന്നാമത്തേത്, നിങ്ങള്‍ക്കുള്ള
പരിഹാരങ്ങളുടെ എണ്ണം
കുറയ്ക്കാന്‍ വളരെ
വ്യവസ്ഥാപിതമായ
നടപടിക്രമങ്ങള്‍
പാലിച്ചു എന്നതാണ്
ആദ്യകാര്യം.
ഒന്നിലധികം പരിഹാരങ്ങളിലൂടെ
നിങ്ങള്‍ അവസാനിപ്പിക്കാവുന്ന
മികച്ച ശ്രമങ്ങള്‍
പോലും വളരെ സാധാരണമാണ്.
Akaike information criteria or Bayes information
criteria പോലുള്ള വിവര
സിദ്ധാന്തങ്ങള്‍
നിങ്ങള്‍ പ്രയോഗിക്കുന്നു.
ഒപ്പം മാതൃകാ അവസാന
ഉപയോഗവും സൂക്ഷിക്കുക.
നിങ്ങളുടെ മോഡല്‍
ഓണ്‍ലൈനായി നടപ്പിലാക്കേണ്ടതുണ്ട്.

Bengali: 
হওয়ার আগে, এই প্রশ্নটি
নিয়ে ডিস্টিটিসিস্টিক
বা স্টোরেস্টিকের
উপর এই আলোচনা বন্ধ
করা ভাল - আমরা কখন
ডিজিপিটি নিন্দনীয়
বা স্টোচাস্টিক হতে?
কেউ কি এসে আমাকে
বলবে?
অবশ্যই না. আমি সাহিত্যে
খুঁজে পেতে পারি?
কিছু কিছু ক্ষেত্রে
হ্যাঁ, কিন্তু বেশিরভাগ
সময়ে কোনও প্রক্রিয়াটি
আমি দেখছি না।
সুতরাং, একটি অগ্রাধিকার
জানা একটি উপায়
আছে?
ভাল, দুর্ভাগ্যবশত,
আপনার জন্য একটি
নিখুঁত সূত্র আছে
কিনা তা নির্ধারণ
করতে হবে যে তথ্যটি
একটি নিয়ন্ত্রক
বা স্টোকাস্টিক প্রক্রিয়া
থেকে বেরিয়ে আসছে;
কিন্তু আপনি যা জানেন
তা আপনি কতটুকু জানেন

Tamil: 
மூலம் அவற்றைப் பற்றி
ஒரு மிக முக்கியமான
படிப்படியாக அறிக்கையிடுகிறது.
எந்த அளவுருவுக்கு
எப்போதும் பொருந்துகிறது,
ஒரு கருதுகோள் சோதனைக்கு
மதிப்பீடு - இது போதுமானதாக
இருந்தாலும் சரி,
ஸிரோ (zero) அல்லாத ஸிரோ
(zero) மதிப்பை நீங்கள்
பெற்றிருந்தாலும்,
உண்மையிலேயே நீங்கள்
ஸிரோ (zero) பெற்றிருக்கிறீர்களா.
எனவே, நீங்கள் ஸிரோ
(zero) என்ற அளவுகோலைப்
ஸிரோ (zero) சோதிக்க
வேண்டும் - இது நல்
ஹைப்போதீசிஸ் (null
hypothesis), பின்னர் ஒரு
புள்ளிவிவர ஒலித்தன்மையுடன்
செயல்படும்.
இரண்டாவதாக, நம்பகமான
பகுதிகள் மற்றும்
பிழைகள் மதிப்பீடுகளில்
அறிக்கை செய்யவும்.
உண்மையில், நம்பகமான
பகுதிகள் மற்றும்
பிழைகள் கணிப்பீடு
உங்கள் கருதுகோள்
சோதனைகளின் ஒருங்கிணைந்த
பகுதியாகும்.
பின்னர், நீங்கள்
மாடல்(model)களை உருவாக்கினால்,
மாதிரிகள் செல்லுபடியாகும்.
நான் இங்கே மாதிரிகள்
என்று சொல்லும்போது,
​​பின்னடைவு மாதிரிகள்
இருக்கக் கூடாது,
அது வகுப்பறைகளாகவும்
இருக்கலாம்.
மேலும் பல மாதிரிகள்
அடையாளம் காணப்பட்டால்,
நிபந்தனைகளின் கலவையைப்
பயன்படுத்தவும்;
நான் முன்பு கூறியது
போல், தனிப்பட்ட
பதில் இல்லை; வழக்கமாக,
அந்த வழக்கு.
என் மாணவர்கள் எப்பொழுதும்
என்னிடம் கேட்கிறார்கள்,
நானும் இரண்டு அல்லது
மூன்று மாதிரிகள்
தரவை விளக்குகிறேன்,
நான் எதைத் தேர்வு
செய்ய வேண்டும்?
நன்றாக, முதல் விஷயம்,
நீங்கள் பல தீர்வுகள்,
மிக பொதுவான முடிவடையும்
முயற்சிகள் சிறந்த
போதிலும் கூட நீங்கள்
தீர்வுகள் எண்ணிக்கை
குறைக்க மிகவும்
முறையான நடைமுறை

Marathi: 
मान्य करा. जेव्हा
मी येथे मॉडेल म्हणतो,
प्रतिगमन मॉडेल न
होऊ द्या, तो क्लासिफायर
देखील असू शकतो. आणि
जर एकापेक्षा जास्त
मॉडेल्सची ओळख पटली
तर मापदंडांचा वापर
करा. जसे मी आधी उल्लेख
केला आहे, तेथे अद्वितीय
उत्तर असू शकत नाही;
विशेषत :, असे आहे.
माझे विद्यार्थी
मला नेहमी विचारतात,
की माझ्याजवळ डेटाचे
स्पष्टीकरण दोन किंवा
तीन मॉडेल आहेत, मी
कोणाला निवडावे?
ठीक आहे, पहिली गोष्ट
ही आहे की आपण केलेल्या
उपाययोजनांची संख्या
कमी करण्यासाठी खूप
पद्धतशीर पद्धत वापरली
आहे आणि सर्वोत्तम
प्रयत्नांशिवाय
आपण अनेक समाधानासह
समाप्त करू शकता,
अगदी सामान्य.
मग आपण माहिती काय
म्हणून ओळखले जातात
जसे की अकेइक माहिती
मापदंड किंवा बायसिनformation
मापदंड.
आणि मॉडेलचा शेवटचा
वापर देखील ठेवा;
आपले मॉडेल ऑनलाइन
अंमलात आणणे आवश्यक
आहे; म्हणून, अंदाजपत्रकाच्या
अचूकतेवर बलिदान
केलेल्या बडबडसह
सोपी मॉडेलला प्राधान्य
दिले जाते आणि इत्यादी.

Gujarati: 
વાત કરીશું જ્યારે
અમે યોજનાકીય પર
પાછા જઈશું અને ડેટા
એનાલિસિસ( data analysis)માં
સામેલ વ્યવસ્થિત
પ્રક્રિયાની ચર્ચા
કરીશું.
તેથી, આસ્થાપૂર્વક,
તમે સમજી શકો છો કે
જ્યાં ડેટા એનાલિસિસ(
data analysis) સમાવિષ્ટ છે.
તે વાસ્તવમાં માહિતીના
વિશ્વને અવલોકનોની
વિશ્વને જોડે છે.
એનાલિસિસ(analysis)ના ઘણા
પ્રકારો છે, દેખીતી
રીતે, હવે, તમારા એનાલિસિસ(analysis)ની
જરૂરિયાત અને અંતિમ
ઉપયોગને આધારે, અને
સાહિત્યમાં તમે શોધી
શકો તેવા અનેક વર્ગીકરણો
છે. હું જે અહીં સૂચિબદ્ધ
છે તે કોઈ પણ રીતે
પૂર્ણ નથી. એનાલિસિસ(analysis)નું
એક સામાન્ય વર્ગીકરણ
જે તમે જુઓ છો તે ખુલાસાત્મક
છંદો છે. તપાસના સંશોધનના
પ્રકારમાં, તમે કંઈપણ
આગમતી ધારણા ને અનુમતિ
આપતા નથી, પરંતુ તમે
ફક્ત ડેટાને શોધી
રહ્યા છો અને તમારી
પ્રક્રિયા સમજવા
પ્રયાસ કરી રહ્યાં
છો. દાખલા તરીકે, તે
સરેરાશ અથવા પ્રમાણભૂત
વિચલન અથવા ગ્રાફને
જોઈ શકે છે, તે સમજવા
પ્રયાસ કરી રહ્યું
છે કે પ્રક્રિયા
રેખીય અથવા બીજી
છે અને તેથી વધુ; પ્રક્રિયા
ઢચુપચું છે કે નહીં
તે સમજવાનો પ્રયાસ
કરી રહ્યું છે. દ્રશ્ય
ઘણો છે વત્તા કેટલાક
વર્ણનાત્મક આંકડાકીય
એનાલિસિસ(analysis) સામેલ

English: 
of sacrifice on the accuracy of the prediction
and so on.
So, again there is no unique answer, but in
the end, the final results that you report
should have two things: a statistical backing
to it and a sound argument to why you have
decided to report these results and why the
results are the way they are.
So, therefore, you should remember data analysis
is not just science alone. Yes, a big part
of it is science, but an important part of
it is also an art. Data analysis is, therefore,
both a science and an art. And never report
estimates without reporting confidence regions
and errors; as much as possible, you should
definitely do that. Of course, in very complicated
parameter estimation problems, it may be very
difficult to obtain confidence regions, but
you should try despite a best of your… try
to put in the best of your efforts to report
the errors and the confidence intervals.

Malayalam: 
അതിനാല്‍, കൃത്യതയിലും,
സൂക്ഷ്മതയിലും ലളിതമായ
മാതൃകയാണ് സങ്കീര്‍ണ്ണമായതിനേക്കാള്‍
നല്ലത്.
അതിനാല്‍ വീണ്ടും
ഒരു പ്രത്യേകഉത്തരവും
ഇല്ല. എന്നാല്‍ ഒടുവില്‍,
നിങ്ങള്‍ റിപ്പോര്‍ട്ട്
ചെയ്യുന്ന അന്തിമഫലങ്ങള്‍
രണ്ട് കാര്യങ്ങള്‍
ഉണ്ടായിരിക്കണം.
ഇത് ഒരു സ്റ്റാറ്റിസ്റ്റിക്കല്‍
പിന്തുണയും നിങ്ങള്‍
ഈ ഫലങ്ങള്‍ എങ്ങനെ
റിപ്പോര്‍ട്ട് ചെയ്യണമെന്ന്
തീരുമാനിച്ചതിന്‍റെ
കാരണവും എന്തുകൊണ്ട്
ഫലങ്ങള്‍ അങ്ങനെ
ലഭിച്ചതെന്നും, അതിനാല്‍
ശാസ്ത്രീയമായി മാത്രമല്ല,
ഡാറ്റ വിശകലനം ഓര്‍ക്കേണ്ടത്.
അതെ, അതിന്‍റെ ഒരു
വലിയ ഭാഗം ശാസ്ത്രമാണ്.
പക്ഷേ, അതിന്‍റെ
ഒരു പ്രധാനഭാഗവും
ഒരു കലയാണ്.
അതിനാല്‍ ഡാറ്റ വിശകലനം
ശാസ്ത്രവും കലയുമാണ്.
ആത്മവിശ്വാസമില്ലാതെ
പ്രദേശങ്ങളും പിശകുകളും
റിപ്പോര്‍ട്ട് ചെയ്യരുത്.
കഴിയുന്നത്ര പരമാവധി,
നിങ്ങള്‍ തീര്‍ച്ചയായും
അത് ചെയ്യണം.
വളരെ സങ്കീര്‍ണ്ണമായ
പരാമീറ്റര്‍ കണക്കുകൂട്ടുന്ന
പ്രശ്നങ്ങളില്‍,
ആത്മവിശ്വാസം ലഭിക്കുന്ന
പ്രദേശങ്ങള്‍ നേടിയെടുക്കാന്‍
വളരെ ബുദ്ധിമുട്ടായേക്കാം.
എന്നാല്‍ നിങ്ങളുടെ
ഏറ്റവും മികച്ച ഒരു
ഒന്നിന് ശ്രമിക്കേണ്ടതാണ്ٹ
പിശകുകള്‍ റിപ്പോര്‍ട്ട്
ചെയ്യുന്നതിന് ആത്മവിശ്വാസം
നല്‍കുന്നതിനും
നിങ്ങളുടെ പരിശ്രമങ്ങളില്‍
ഏറ്റവും മികച്ചത്

Marathi: 
तर, पुन्हा एकमेव
उत्तर नाही, परंतु
अखेरीस, आपण नोंदवलेले
अंतिम निष्कर्ष दोन
गोष्टी असावेत: एक
सांख्यिकीय आधार
आणि त्यावर तर्क
करणे आणि तर्क करणे
का आहे की आपण या परिणामांचा
अहवाल देण्याचा निर्णय
का घेतला आणि परिणाम
का मार्ग आहे ते आहेत.
म्हणूनच, तुम्हाला
हे लक्षात ठेवायला
हवे की डेटा विश्लेषणाचा
अर्थ केवळ विज्ञानच
नाही. होय, त्याचा
मोठा भाग विज्ञान
आहे, परंतु त्याचा
एक महत्त्वाचा भाग
म्हणजे एक कला आहे.
म्हणून डेटा विश्लेषण
म्हणजे विज्ञान आणि
कला दोन्ही.
आत्मविश्वास क्षेत्र
आणि त्रुटींचा अहवाल
न देता आणि अहवाल
अंदाज कधीही देऊ
नका; जितकी शक्य असेल
तितकी, आपण हे निश्चितपणे
केले पाहिजे.
अर्थात, अतिशय जटिल
पॅरामीटर अंदाज प्रक्रियेत,
आत्मविश्वास क्षेत्र
प्राप्त करणे कठीण
होऊ शकते, परंतु आपल्यापैकी
सर्वोत्कृष्ट असूनही
आपण प्रयत्न करणे
आवश्यक आहे ... त्रुटी
आणि आत्मविश्वास
अंतराळ अहवाल देण्यासाठी

Bengali: 
তা নিয়ে যেতে হবে।
এটা প্রক্রিয়া সম্পর্কে
সুতরাং, একটি উদাহরণ
হিসাবে, ধরুন আমি
একটি বল রাখা, একটি
রুমে, যেখানে অনেক
বাতি নেই।
বায়ু মোটামুটি এখনও
আছে এবং আমি বলটি
ড্রপ করতে যাচ্ছি।
আমরা পদার্থবিজ্ঞানের
সাহায্যে বেশ কিছুটা
হিসাব করতে পারি
যে বলটি মাটিতে আঘাত
করার জন্য কতক্ষণ
লাগবে এটা মোটামুটি
একটি নির্ধারক প্রক্রিয়া।
সেখানে এত অনিশ্চয়তা
নেই অন্য দিকে, যদি
আমি জিজ্ঞাসা করা
হয় যে আগামীকাল
বৃষ্টি হতে পারে
কিনা বা ৬ মাসে তা
বৃষ্টি হতে যাচ্ছে
কিনা বা যদি আমি অন্য

Hindi: 
बलिदान के साथ जटिल
मॉडल को सरल मॉडल
पसंद किया जाता है
और इसी तरह।
तो, फिर से कोई अनूठा
उत्तर नहीं है, लेकिन
अंत में, आपके द्वारा
रिपोर्ट किए गए अंतिम
परिणामों में दो
चीजें होनी चाहिए:
इसके लिए एक सांख्यिकीय
समर्थन और एक ठोस
तर्क है कि आपने इन
परिणामों की रिपोर्ट
करने का निर्णय क्यों
लिया है और परिणाम
क्यों हैं वो हैं।
इसलिए, आपको याद रखना
चाहिए कि डेटा विश्लेषण
(DATA ANALYSIS)सिर्फ विज्ञान
ही नहीं है।
हां, इसका एक बड़ा
हिस्सा विज्ञान है,
लेकिन इसका एक महत्वपूर्ण
हिस्सा भी एक कला
है।
डेटा विश्लेषण, इसलिए,
एक विज्ञान और एक
कला दोनों है।
और विश्वास क्षेत्रों
और त्रुटियों की
रिपोर्ट किए बिना
अनुमानों की रिपोर्ट
कभी नहीं करें; जितना
संभव हो, आपको निश्चित
रूप से ऐसा करना चाहिए।
बेशक, बहुत ही जटिल
पैरामीटर अनुमान
समस्याओं में, आत्मविश्वास
क्षेत्रों को प्राप्त
करना बहुत मुश्किल
हो सकता है, लेकिन
आपको अपने सर्वश्रेष्ठ
प्रयासों के बावजूद
प्रयास करना चाहिए
... त्रुटियों और आत्मविश्वास
अंतराल की रिपोर्ट
करने के अपने प्रयासों

Tamil: 
தொடர்ந்து என்று
உறுதி ஆகும்.
அக்கைகே தகவல் அளவுகோல்
(Akaike information criteria) அல்லது
பேயெஸ் தகவல் அளவுகோல்
(Bayes information criteria) தத்துவார்த்த
நடவடிக்கைகளாக நீங்கள்
அறியப்படுகிறீர்கள்.
மாதிரியின் இறுதிப்
பயன்பாட்டை வைத்துக்கொள்ளுங்கள்;
உங்கள் மாதிரியை
ஆன்லைனில் (online) செயல்படுத்த
வேண்டும்;
எனவே, எளிமையான மாதிரியானது
ஒரு சிக்கலான ஒரு
முன்னுரையை துல்லியமாக
தியாகம் செய்வதன்
மூலம் பலியாகும்.
எனவே, மறுபடியும்
தனித்துவமான பதில்
இல்லை, ஆனால் இறுதியில்,
நீங்கள் தெரிவிக்கும்
இறுதி முடிவு இரண்டு
காரியங்களைக் கொண்டிருக்க
வேண்டும்: இது ஒரு
புள்ளிவிவர ஆதரவு
மற்றும் ஏன் இந்த
முடிவுகளை அறிவிக்க
முடிவு செய்துள்ளீர்கள்
என்பதற்கான தெளிவான
வாதம் மற்றும் முடிவுகள்
ஏன் வழி அவர்கள்
இருக்கிறார்கள்.
ஆகையால், டேட்டா
அனாலிசிஸ் (Data Analysis)
என்பது அறிவியல்
மட்டும் அல்ல.
ஆமாம், அது ஒரு பெரிய
பகுதியாக அறிவியல்,
ஆனால் அது ஒரு முக்கிய
பகுதியாக ஒரு கலை.
டேட்டா அனாலிசிஸ்
(Data Analysis), எனவே, ஒரு விஞ்ஞானம்
மற்றும் ஒரு கலை.
நம்பிக்கை பகுதிகள்
மற்றும் பிழைகள்
குறித்து அறிக்கையிடாமல்
ஒருபோதும் அறிக்கையிட
வேண்டாம்; முடிந்தவரை,
நீங்கள் நிச்சயமாக
அதை செய்ய வேண்டும்.
நிச்சயமாக, மிகவும்
சிக்கலான அளவுரு
மதிப்பீடு சிக்கல்களில்,
அது நம்பிக்கையுள்ள
பிரதேசங்களைப் பெற
மிகவும் கடினமானதாக
இருக்கலாம், ஆனால்
உங்கள் மிகச் சிறந்த

Kannada: 
ಇದು ಎಂದಿಗೂ ಆ ರೀತಿಯಾಗಿರುವುದಿಲ್ಲ,
ಬಹಳ ವಿರಳವಾಗಿ.
ಆದ್ದರಿಂದ, ಅವರು ಅನುಕ್ರಮವಾಗಿ
ಅಗತ್ಯವಿರುವುದಿಲ್ಲ,
ಆದರೆ ಅದರಲ್ಲಿ ಒಂದು
ನಿರ್ದಿಷ್ಟ ಕ್ರಮವಿದೆ.
ನೀವು ಆಕಸ್ಮಿಕ ವಿಧಾನದಲ್ಲಿ
ಮಾಡುತ್ತಿದ್ದೀರಿ
ಎಂದು ಅರ್ಥವಲ್ಲ.
ಯಾವುದೇ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ
ವ್ಯಾಯಾಮದ ಯಶಸ್ಸು
ಎರಡು ವಿಷಯಗಳ ಮೇಲೆ
ಅವಲಂಬಿತವಾಗಿದೆ ಎಂಬುದನ್ನು
ನೆನಪಿಡಿ: ನೀವು ಸಂಗ್ರಹಿಸಿದ
ಡೇಟಾದ ಗುಣಮಟ್ಟ ಮತ್ತು
ವ್ಯವಸ್ಥಿತ ಕಾರ್ಯವಿಧಾನ
ಅಥವಾ ನೀವು ಹೊಂದಿರುವ
ವಿಧಾನಗಳು, ನೀವು ಡೇಟಾ
ವಿಶ್ಲೇಷಣೆ ಅಥವಾ ಸಂಪೂರ್ಣ
ವಿಧಾನದ ವಿಧಾನದಲ್ಲಿ
ಬಳಸಿದ ಉಪಕರಣಗಳು ನೀವು
ಅನುಸರಿಸಿದ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ.
ಡೇಟಾ ಗುಣಮಟ್ಟ ಕೆಟ್ಟದ್ದಾಗಿದ್ದರೆ,
ನೀವು ಹೆಚ್ಚು ಮಾಡಲು
ಸಾಧ್ಯವಿಲ್ಲ.
ನೀವು ವ್ಯವಸ್ಥಿತ ಕಾರ್ಯವಿಧಾನವನ್ನು
ಅನುಸರಿಸುತ್ತಿದ್ದರೂ
ಸಹ, ನೀವು ಅದ್ಭುತ ಫಲಿತಾಂಶಗಳನ್ನು
ಪಡೆಯದಿರಬಹುದು; ಮತ್ತು
ಮಾಹಿತಿಯ ಗುಣಮಟ್ಟವು
ಉತ್ತಮವಾಗಿದ್ದರೂ
ಸಹ, ನೀವು ತುಂಬಾ ಅನೈಸ್ಟಾಮ್ಯಾಟಿಕ್
ಕಾರ್ಯವಿಧಾನವನ್ನು
ಅನುಸರಿಸುತ್ತೀರಿ
ಮತ್ತು ನೀವು ಅತ್ಯಂತ
ಕಡಿಮೆ ಅಂದಾಜುದಾರನನ್ನು
ಬಳಸುತ್ತೀರಿ, ನೀವು
ಕಳಪೆ ಅಂದಾಜಿನೊಂದಿಗೆ
ಕೊನೆಗೊಳ್ಳಬಹುದು.
ಆದ್ದರಿಂದ, ಎರಡೂ ಮುಖ್ಯವಾಗಿವೆ.
ಈಗ, ಮಾಹಿತಿಯ ಗುಣಮಟ್ಟ
ನಮ್ಮ ಕೈಯಲ್ಲಿ ಇಲ್ಲ,
ಆದರೆ ನೀವು ಡೇಟಾವನ್ನು
ನೋಡಿದಾಗ ಹೇಳಲು ಸಾಧ್ಯವಾಗುವಂತಹ
ಸಿದ್ಧಾಂತದ ಕುರಿತು
ನೀವು ತಿಳಿದಿರಲಿ ಮತ್ತು
ಈ ಡೇಟಾ ಗುಣಮಟ್ಟ ಉತ್ತಮವಾಗಿಲ್ಲ
ಎಂದು ಹೇಳಿ ನಾನು ಒಳ್ಳೆಯ
ಫಲಿತಾಂಶಗಳನ್ನು ನಿರೀಕ್ಷಿಸಬಾರದು.
ನೀವು ಸಲಹೆಗಾರರಾಗಿದ್ದೀರಿ,
ಮತ್ತು ನಿಮಗೆ ಕೆಲವು
ಡೇಟಾವನ್ನು ನೀಡಲಾಗಿದೆ,
ಪ್ರಕ್ರಿಯೆಯ ಉದ್ಯಮದ
ಮೂಲಕ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಗಾಗಿ
ನೀವು ನೇಮಕಗೊಂಡಿದ್ದೀರಿ
ಮತ್ತು ನಿಮಗೆ ಕೆಲವು
ಡೇಟಾವನ್ನು ನೀಡಲಾಗುತ್ತದೆ,
ನೀವು ಮಾಡಬೇಕಾದ ಮೊದಲ
ವಿಷಯವು ಡೇಟಾದ ಗುಣಮಟ್ಟವನ್ನು
ನೋಡುತ್ತದೆ ಮತ್ತು
ನೀವು ನಿರೀಕ್ಷಿಸಬಹುದಾದ
ಫಲಿತಾಂಶಗಳ ಸ್ವಭಾವವು
ಎಷ್ಟು ಒಳ್ಳೆಯದು ಎಂಬುದರ
ಅರ್ಥಗರ್ಭಿತ ಮೌಲ್ಯಮಾಪನವನ್ನು
ಮಾಡಿ. ಡೇಟಾ ಗುಣಮಟ್ಟ
ತೀರಾ ಕೆಟ್ಟದಾದರೆ,
ನೀವು ಡೇಟಾವನ್ನು ಹಿಂತಿರುಗಿಸಬೇಕು
ಮತ್ತು ಅದ್ಭುತಗಳನ್ನು
ಅಪೇಕ್ಷಿಸಬಾರದು ಎಂದು
ಹೇಳಬೇಕು.
ಡೇಟಾವನ್ನು ಉತ್ತಮ
ವಿಧಾನದಲ್ಲಿ ಸಂಗ್ರಹಿಸಬೇಕಾಗಿದೆ,
ಆದ್ದರಿಂದ ಅದು ಮಾಹಿತಿಯುಕ್ತ
ಆಲ್ರೈಟ್ ಎಂದು ಕರೆಯಲ್ಪಡುತ್ತದೆ.
ಆದ್ದರಿಂದ, ದಯವಿಟ್ಟು
ಮನಸ್ಸಿನಲ್ಲಿಟ್ಟುಕೊಳ್ಳಿ.
ಈಗ, ಈ ಉಪನ್ಯಾಸದ ಆರಂಭದಲ್ಲಿ
ನಾವು ನೋಡಿದ ರೇಖಾಚಿತ್ರವನ್ನು
ನಾವು ಪುನಃ ವಿಶ್ಲೇಷಿಸುತ್ತೇವೆ,
ಇದು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ
ವ್ಯವಸ್ಥಿತ ಪ್ರಕ್ರಿಯೆಯ
ಬಗ್ಗೆ ನಮಗೆ ಕೆಲವು
ಕಲ್ಪನೆಯನ್ನು ನೀಡುತ್ತದೆ.
ಆದ್ದರಿಂದ, ಮೇಲ್ಭಾಗದಲ್ಲಿ,
ನಾವು ಪ್ರಕ್ರಿಯೆಯಿಂದ
ಹೊರಬರುವ ಡೇಟಾವನ್ನು
- ಚೆನ್ನಾಗಿ, ಸಂವೇದಕಗಳಿಂದ
- ಮತ್ತು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿನ
ಮೊದಲ ಹೆಜ್ಜೆ ಮೂರು
ಪ್ರಾಥಮಿಕ ಹಂತಗಳ ಮೂಲಕ
ಹೋಗುತ್ತದೆ: ದೃಶ್ಯೀಕರಣ,
ಗುಣಮಟ್ಟದ ಪರಿಶೀಲನೆ,
ಮತ್ತು ಪೂರ್ವ-ಸಂಸ್ಕರಣೆ.
ಈಗ, ಈ ಒಳಗೆ ಮತ್ತೆ,
ಇದು ಅನುಕ್ರಮವಾಗಿ
ಅಗತ್ಯವಿಲ್ಲ.
ಸಾಮಾನ್ಯವಾಗಿ, ಮೊದಲ
ಹಂತವು ನಮ್ಮ ಡೇಟಾವನ್ನು
ರೂಪಿಸಲು ಕಾರಣ ಏಕೆಂದರೆ
ಸಂಖ್ಯೆಗಳು ನಿಮಗೆ
ಹೆಚ್ಚು ಹೇಳಬಾರದು,
ಆದರೆ ಚಿತ್ರಗಳನ್ನು
ನಿಮಗೆ ಹೆಚ್ಚು ಹೇಳುತ್ತವೆ
ಮತ್ತು ಅದು ನಿಜವಾಗಿಯೂ
ನಿಮ್ಮನ್ನು ಇಲ್ಲಿ
ಸ್ಲೈಡ್ಗೆ ಕರೆದೊಯ್ಯಲು
ಇದು Anscombe ಡೇಟಾ ಸೆಟ್
ಎಂದು ಕರೆಯಲ್ಪಡುವ
ಆಧಾರದ ಮೇಲೆ ಅತ್ಯಂತ
ಸಾಮಾನ್ಯವಾದ ಉದಾಹರಣೆಯಾಗಿದೆ.
ಮತ್ತು ಈ ಡೇಟಾ ಸೆಟ್
R ನಲ್ಲಿಯೂ ಸಹ ಲಭ್ಯವಿರುತ್ತದೆ,

Bengali: 
কোন বায়ুমণ্ডল প্রক্রিয়াকরণ
বৈশিষ্ট্য বা এমনকি
অর্থনীতিশ্রমিক
প্রক্রিয়ার দিকে
তাকিয়ে থাকি অথবা
সেন্সরের শব্দ আর
তাই উপর, উদাহরণস্বরূপ,
সেন্সরের ত্রুটি
পরবর্তী মান কি ভবিষ্যদ্বাণী
করা খুব কঠিন।
এই পরিস্থিতিতে,
আমরা সম্ভাব্যতা
তত্ত্বে আশ্রয় গ্রহণ
করি এবং আমরা বলি
যে প্রক্রিয়াটির
সঠিক জ্ঞান নেই।
অতএব, আমি অনুমান
করব যে সেখানে অনেক
সম্ভাবনার সম্ভাবনা
রয়েছে, এবং আমি এইসব
সম্ভাব্যতার প্রত্যেকের
সম্ভাবনাকে অর্পণ
করি এবং সেই সম্ভাবনা
যেখানে সম্ভাব্যতার
তত্ত্ব জন্ম নেয়
এবং সেই সময়ে যেখানে
সময় সিরিজ বিশ্লেষণ
আসে সেখানে এমন একটি

Gujarati: 
છે; જ્યારે પુષ્ટિકરણ
એનાલિસિસ(analysis)માં
તમારી પાસે અનુમતિ
છે, અને તમે ડેટાને
ધ્યાનમાં રાખીને
ખાતરી કરો કે તમારી
પાસે શું છે તે સાચું
છે કે નહીં. તેથી,
દેખીતી રીતે, ત્યાં
થોડી વિપરીત છે અને
પછી, તમારી પાસે સંખ્યાત્મક
છંદો ની ગુણાત્મક
માહિતી એનાલિસિસ(analysis)
છે. ગુણાત્મક ડેટા
એનાલિસિસ( data analysis)માં,
ઉદાહરણ તરીકે, તમે
પ્રવાહો જુઓ છો; તમે
ચોક્કસ લક્ષણો અને
ઓસિલેટીય ફીચર્સ(oscillative
features) શોધી રહ્યાં
છો, ઉદાહરણ તરીકે.
જયારે, માત્રાત્મક
રીતે તમે છો ... તમે
તમારા એનાલિસિસ(analysis)ના
આંકડાકીય પરિણામો
જોઈ રહ્યા છો. તે પછી,
તમારી પાસે વર્ણનાત્મક
છંદો કહેવામાં આવે
છે. અને વર્ણનાત્મક
એનાલિસિસ(analysis)માં,
ફરીથી, તે વધુ કે ઓછા
શોધની જેમ છે; જ્યારે
અનુમાનિત રીતે તમે
માહિતીથી ઘણું વિશિષ્ટ
મૂલ્યાંકન કરવાનો
પ્રયાસ કરી રહ્યા
છો અને તમે તેને પૂર્વધારણા
પરીક્ષણમાં આધિન
કરી રહ્યા છો. તેથી,
ત્યાં ઘણાં બધાં
વ્યવસ્થિત, સંખ્યાત્મક
અને આંકડાકીય એનાલિસિસ(analysis)
સામેલ છે જે અનુમાનિત
એનાલિસિસ(analysis)માં
સામેલ છે, અને આ મોટા
એનાલિસિસ(analysis)નો એક
ભાગ હોઈ શકે છે કે
તમે એક મોડેલ બનાવવા
અને આમ કરવાથી આમ
કરો છો. જયારે વર્ણનાત્મક
એનાલિસિસ(analysis) સીધી
રીતે મોટા એનાલિસિસ(analysis)માં
જાવું નથી; તે ખાસ
કરીને ડેટા એનાલિસિસ(data
analysis) માં પ્રથમ પગલું
છે. તે પછી, તમારી
પાસે આગાહીયુક્ત
છંદો નિર્ધારિત છે.
આગાહીયુક્ત પૃથ્થકરણ
એ છે કે જ્યાં માહિતી
ડેટા પર આધારિત છે
તે ક્યાં છે તે વિશે
પૂછવું.
અને આ ઘણા લોકોમાં
ઘણા ઉપયોગી છે; જ્યારે
આદેશપત્રો એ પૂછવું
છે કે શા માટે કંઈક
થયું છે તેથી, તમે
ડેટા પર ક્યાં તો
ડૉક્ટર તરીકે અથવા
ઈજનેર તરીકે અથવા
અર્થશાસ્ત્રી તરીકે
જોવામાં આવ્યા છે
અને તમે બજારના ડેટા
પર જોયું છે, અને અચાનક
એક અકસ્માત થયો છે,
અને તમે સારી રીતે
પૂછો છો - શા માટે
આ ક્રેશ થયું અથવા
શા માટે થયું?
એક ચોક્કસ દોષ પ્રક્રિયામાં
થાય છે અને તેથી વધુ.
અને પછી, તમે અલબત્ત,
આને કેવી રીતે અટકાવશો
તે સૂચવવાનું છે
તેથી, નિશ્ચિત એનાલિસિસ(analysis)માં

Malayalam: 
ചെയ്യാന്‍ ശ്രമിക്കുക.
ഇവയാണ് ചില റഫറന്‍സുകള്‍.
തീര്‍ച്ചയായും.
അത് സമ്പൂര്‍ണ്ണമല്ല.
ഈ പുസ്തകങ്ങളില്‍
നിന്നും ചില ഉദാഹരണങ്ങളും
ചില വസ്തുക്കളും
ഞാന്‍ എടുത്തിട്ടുണ്ട്.
ഇത് നിങ്ങള്‍ക്ക്
വളരെ പ്രയോജനകരമാവുന്ന
തരത്തില്‍, ആദ്യം
കാണിച്ചിരിക്കുന്നത്
random data analysis ആണ്. ഈ പ്രയോജനകരമായ
പുസ്തകം 30-40 വര്‍ഷത്തെ
പ്രവര്‍ത്തനത്തില്‍
നിന്ന് വ്യത്യസ്തങ്ങളായ
ഡാറ്റകള്‍ കണ്ടു.
അവയ്ക്ക് ഉദാഹരണങ്ങള്‍
ഉണ്ട്.
അവരുടെ പാഠപുസ്തകങ്ങളില്‍
നല്ല ഉദാഹരണങ്ങളുണ്ട്.
ശേഷിക്കുന്ന മൂന്ന്
പുസ്തകങ്ങളും ജോണ്‍സണ്‍,
മോണ്ട്ഗോ and, റങ്കര്‍
എന്നിവരുടെ സ്റ്റാറ്റിസ്റ്റിക്സ്
and പ്രൊബബിലിറ്റി
ക്ലാസിക് പുസ്തകങ്ങളാണ്.
Oggunaike ന്‍റെ പുസ്തകം
എഞ്ചിനീയര്‍മാര്‍ക്കുള്ള
പ്രോബബിലിറ്റി ആന്‍റ്
സ്റ്റാറ്റിസ്റ്റിക്സ്
എന്നീ അടിസ്ഥാനതത്ത്വങ്ങള്‍
നല്‍കുന്നു.
നിങ്ങള്‍ ഒരു എഞ്ചിനീയറാണെങ്കില്‍,
ആ പുസ്തകം നോക്കിയാല്‍,
നിങ്ങള്‍ വാസ്തവത്തില്‍
താല്പര്യം ഉണ്ടാകും.
തീര്‍ച്ചയായും, നിങ്ങള്‍ക്ക്
പരാമര്‍ശിക്കാവുന്ന
നൂറ് കണക്കിന് മറ്റ്
പുസ്തകങ്ങള്‍ ഉണ്ട്.
അതിനാല്‍, നിങ്ങള്‍
ഈ പ്രഭാഷണം ആസ്വദിച്ചെന്ന്
പ്രതീക്ഷിക്കുന്നു.
ചുരുങ്ങിയത് വിവര
വിശകനത്തെക്കുറിച്ച്
നിങ്ങള്‍ക്ക് എന്ത്
മുന്‍കരുതല്‍ നടപടികള്‍
കൈക്കൊള്ളണം, വിവര
വിശകലനങ്ങളില്‍,

Kannada: 
ಅದು ನೀವು ಅನುಸ್ಥಾಪಿಸಿದಾಗ
ಅದರೊಂದಿಗೆ ಬರುತ್ತದೆ.
ಈಗ, ಈ Anscombe ಡೇಟಾ ಸೆಟ್ನ
ಸೌಂದರ್ಯವು ... ನಾನು
ಇಲ್ಲಿ ನಿಮಗೆ ತೋರಿಸುವದನ್ನು
ವಿವರಿಸುತ್ತೇನೆ.
ಜೋಡಿಗಳ ಅಸ್ಥಿರಗಳ
ಪೈಕಿ ನಾನು ಇಲ್ಲಿ
ನಾಲ್ಕು ಡೇಟಾ ಸೆಟ್ಗಳನ್ನು
ಹೊಂದಿದ್ದೇನೆ; x 1 y 1,
x 2 y 2, x 3 y 3 ಮತ್ತು x 4 y 4 ಎಂದು
ಯೋಚಿಸುತ್ತಾರೆ.
ಅವರು ಎಲ್ಲಾ ದೃಷ್ಟಿಗೆ
ಬಹಳ ಭಿನ್ನವಾಗಿ ಕಾಣುತ್ತಾರೆ;
ಆದಾಗ್ಯೂ, ನೀವು ಡೇಟಾವನ್ನು
ನೋಡದೆ ಇದ್ದರೆ, ಮತ್ತು
ನೀವು ಲೆಕ್ಕಾಚಾರ ಮಾಡಿದ್ದೀರಿ,
ಉದಾಹರಣೆಗೆ, ಅರ್ಥ
ಅಥವಾ ಭಿನ್ನತೆ ಅಥವಾ
ನೀವು ಆಯಾ ಜೋಡಿಗಳ
ನಡುವೆ ಒಂದು ಮಾದರಿಯನ್ನು
ಹೊಂದಿದ್ದೀರಿ ಅಥವಾ
ಪರಸ್ಪರ ಸಂಬಂಧದಲ್ಲಿ
ಲೆಕ್ಕಾಚಾರ ಮಾಡಿದ್ದರೆ,
ಅವರು ಎಲ್ಲಾ ಒಂದೇ
ಆಗಿರಬಹುದು, ಅವರು
ಒಂದೇ ಆಗಿರಬಹುದು.
ಆದ್ದರಿಂದ, ವಿವರಣಾತ್ಮಕ
ಅಂಕಿಅಂಶಗಳು ಅಥವಾ
ನಿಮ್ಮ ಹಿಂಜರಿತದ ಆಧಾರದ
ಮೇಲೆ, ಈ ನಾಲ್ಕು ಡೇಟಾ
ಸೆಟ್ಗಳ ನಡುವೆ ಯಾವುದೇ
ವ್ಯತ್ಯಾಸವನ್ನು ನೀವು
ಮಾಡಲು ಸಾಧ್ಯವಾಗುವುದಿಲ್ಲ.
ಆದಾಗ್ಯೂ, ನೀವು ನೋಡುವಂತೆ,
ಈ ಪ್ರತಿಯೊಂದು ಡೇಟಾದ
ವೈಶಿಷ್ಟ್ಯಗಳಲ್ಲಿ
ಅಂತಹ ವ್ಯಾಪಕ ವ್ಯತ್ಯಾಸವಿದೆ.
ಉದಾಹರಣೆಗೆ, ನೀವು
ಡೇಟಾ ಸೆಟ್ 2 ಅನ್ನು
ನೋಡಿದರೆ, ಪ್ಯಾರಾಬೋಲಿಕ್
ರೀತಿಯ ಸಂಬಂಧವಿದೆ,
ಆದರೆ ಡೇಟಾ ಸೆಟ್ 4,
ಎಲ್ಲಾ ಪಾಯಿಂಟ್ಗಳು
ನೇರ ಸಾಲಿನಲ್ಲಿ ಬರುತ್ತವೆ.
ಪ್ರಾಯೋಗಿಕವಾಗಿ, x
ನಲ್ಲಿ ಯಾವುದೇ ಬದಲಾವಣೆಗಳಿಲ್ಲ,
ಒಂದು ಹೊರಗಿನವರಿಂದ
ಮಾತ್ರ ವೈ ಬದಲಾಗುತ್ತಿದೆ.
ಆದ್ದರಿಂದ, ನಿಮ್ಮ
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಗೆ
ಹೊರಗಿನವರು ಏನು ಮಾಡಬಹುದು
ಎಂಬುದನ್ನು ತೋರಿಸಲು
ಈ ಡೇಟಾ ಸೆಟ್ ತುಂಬಾ
ಉಪಯುಕ್ತವಾಗಿದೆ.
ಹೊರಗಿನವರು ಸಾಮಾನ್ಯ
ವಿಷಯದಿಂದ ಹೊರಬರುವ
ಅಥವಾ ಡೇಟಾದ ಉಳಿದ
ಭಾಗದಿಂದ ಹೊರಬರುವ
ಡೇಟಾ ಬಿಂದುಗಳಾಗಿವೆ.
ವಾಸ್ತವವಾಗಿ, ನೀವು
ಡೇಟಾ ಸೆಟ್ 3 ಅನ್ನು
ನೋಡಿದರೆ, ಎಲ್ಲ ಡೇಟಾ
ಬಿಂದುಗಳು ನೇರ ಸಾಲಿನಲ್ಲಿ
ಸುಳ್ಳು ಒಂದು ಡೇಟಾ
ಬಿಂದುವನ್ನು ಹೊರತುಪಡಿಸಿ
ಹೊರಗಿನ ಹಕ್ಕನ್ನು
ಹೊಂದಿರುತ್ತವೆ.
ಆದ್ದರಿಂದ, ನೀವು ಕೇವಲ
ವಿವರಣಾತ್ಮಕ ಸಂಖ್ಯಾಶಾಸ್ತ್ರವನ್ನು
ನೋಡಿದಾಗ ಎರಡು ಡೇಟಾ
ಸೆಟ್ಗಳು ಸಂಪೂರ್ಣವಾಗಿ
ಒಂದೇ ರೀತಿ ಕಾಣುತ್ತವೆ,
ಆದರೆ ನೀವು ಅವುಗಳನ್ನು
ಆಲೋಚಿಸುವ ಕ್ಷಣದಲ್ಲಿ,
ಒಂದು ದೊಡ್ಡ ವ್ಯತ್ಯಾಸವಿದೆ
ಎಂದು ನಿಮಗೆ ತಿಳಿದಿದೆ.
ತದನಂತರ, ಸಹಜವಾಗಿ,
ಸರಿಪಡಿಸುವ ಕ್ರಮ ಮತ್ತು
ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು
ಸರಿಯಾಗಿ ಹೊರತೆಗೆಯಲು
ಅಗತ್ಯ ಹಂತಗಳನ್ನು
ನಾವು ತೆಗೆದುಕೊಳ್ಳುತ್ತೇವೆ.
ಆದ್ದರಿಂದ, ಇದು ಆಶಾದಾಯಕವಾಗಿ
ಯಾವುದೇ ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಗೆ
ಮುಂಚೆಯೇ ಡೇಟಾವನ್ನು
ದೃಶ್ಯೀಕರಿಸುವ ಅವಶ್ಯಕತೆ
ಇದೆ. ಮತ್ತು ನಂತರ, ವಾಸ್ತವವಾಗಿ,
ನಾವು ಕೇವಲ ಒಂದು ಗುಣಮಟ್ಟದ
ಚೆಕ್ ಮಾಡಿದರು.
ಉದಾಹರಣೆಗೆ, ನಾವು
ಹೊರಗಿನವರ ಉಪಸ್ಥಿತಿಯನ್ನು
ಗಮನಿಸಿದ್ದೇವೆ.
ಅದು ಬಹಳ ಮುಖ್ಯ.
ಅನೇಕ ಬಾರಿ ಅಕ್ಷಾಂಶ
ಕಾಣೆಯಾಗಿದೆ ಮೌಲ್ಯಗಳು
ಬರುತ್ತದೆ.
ಕಾಣೆಯಾದ ಮೌಲ್ಯಗಳನ್ನು
ಹೇಗೆ ಎದುರಿಸಬೇಕು
ಎಂಬುದನ್ನು ನೀವು ನಿರ್ಧರಿಸಬೇಕು.
ನೀವು ಅದನ್ನು ಬದಲಾಯಿಸಲು
ಅಥವಾ ಅದರೊಂದಿಗೆ ವಾಸಿಸಬೇಕೇ,
ಇಂಟರ್ಪೋಲೇಟ್ ಮತ್ತು
ಇನ್ನಿತರ ವಿಷಯಗಳ ಬಗ್ಗೆ
ಸಾಕಷ್ಟು ಸಿದ್ಧಾಂತವು
ಲಭ್ಯವಿದೆ.
ಆದ್ದರಿಂದ ಸ್ಪಷ್ಟವಾಗಿ,
ಇಲ್ಲಿ ಅದರ ಬಗ್ಗೆ
ಮಾತನಾಡಲು ಸಾಧ್ಯವಿಲ್ಲ.

Marathi: 
आपल्या प्रयत्नांना
सर्वोत्तम करण्याचा
प्रयत्न करा.
हे काही संदर्भ आहेत.
अर्थात, कोणताही
मार्ग पूर्णपणे नसतो.
मी या पुस्तकेतील
काही उदाहरणे आणि
काही सामग्री घेतली
आहे; हे सामान्य पुस्तक
आहेत ज्या आपणास
यादृच्छिक डेटा विश्लेषणाविषयीचे
पहिले पुस्तक अतिशय
उपयुक्त ठरते, कारण
हे लोक 30-40 वर्षांपासून
सराव करतात, विविध
प्रकारचे डेटा बघतात
आणि त्यांच्याकडे
उदाहरणे आहेत, त्यांच्या
पाठ्यपुस्तकातील
उत्कृष्ट उदाहरण
आणि उर्वरित तीन,
जर्न्सन आणि मांटगोमेरी
आणि रूंगेर यांनी
किमान पुस्तके, ते
शास्त्रीय पुस्तके
संभाव्यता आणि सांख्यिकी
- लागू करण्यायोग्य
संभाव्यता आणि आकडेवारी.
ऑगुननायकेचे पुस्तक
आपल्याला अभियंत्यांसाठी
संभाव्यता आणि आकडेवारीचे
मूलभूत तत्त्वे देते.
आपण अभियंता असल्यास,
आपल्याला पुस्तक
पाहण्यात खरोखरच
रूची असेल. अर्थात,
आपण वाचू शकतील अशा
इतर शेकडो पुस्तके
देखील आहेत. त्यामुळे
आशा आहे की आपण भाषणाचा
आनंद घेतला आणि आपण
कमीत कमी ते डेटा
विश्लेषण काय आहे,
ते कोणत्या सावधगिरीच्या

English: 
These are some of the references. Of course,
no way it’s exhaustive. I have taken some
of the examples and some material from these
books; these are quite common books of which
you may find the first book on Random Data
Analysis very, very useful to you because
it has been written by people who have practiced
for 30-40 years, seen different kinds of data,
and they have examples, very good examples
in their text books. And the remaining three,
at least the book by Johnson and Montgomery
and Runger, they they are classical books
in probability and statistics - applied probability
and statistics. The book by Ogunnaike gives
you the fundamentals of probability and statistics
for engineers. If you are an engineer, you
may be really interested in looking at the
book. Of course, there are hundreds of other
books that you can refer.
So, hopefully you enjoyed the lecture and

Tamil: 
போதிலும் நீங்கள்
முயற்சிக்க வேண்டும்.
பிழைகளையும் நம்பக
இடைவெளிகளையும்
தெரிவிக்க உங்கள்
முயற்சிகளில் மிகச்
சிறப்பாக முயற்சி
செய்யுங்கள்.
இவை சில குறிப்புகள்.
நிச்சயமாக, எந்த
வழியில் அது தீர்ந்துவிட்டது.
இந்த புத்தகங்களில்
சில எடுத்துக்காட்டுகள்
மற்றும் சிலவற்றை
நான் எடுத்துக் கொண்டேன்;
இந்த நீங்கள் 30 முதல்
40 ஆண்டுகள் பயிற்சி
செய்த மக்கள் எழுதப்பட்ட
ஏனெனில் நீங்கள்
மிகவும் பயனுள்ள,
ரேண்டம் டேட்டா அனாலிசிஸ்
(Random Data Analysis) முதல் புத்தகம்
காணலாம்.
இது மிகவும் பொதுவான
புத்தகங்கள், பல்வேறு
வகையான தரவு பார்த்தேன்,
மற்றும் அவர்கள்
உதாரணங்கள், அவர்களின்
டெஸ்ட் புக்(text book)களில்
மிகவும் நல்ல உதாரணங்கள்.
மீதமுள்ள மூன்று,
குறைந்தபட்சம் ஜான்சன்
(Johnson) மற்றும் மான்ட்கோமரி
(Montgomery) மற்றும் ரங்கர்
(Runger) புத்தகங்கள்,
அவர்கள் புக் அப்ப்ளியேட்
ப்ரோபைபிளிட்டி
அண்ட் ஸ்டாட்டிஸ்டிக்ஸ்
(book applied probability and statistics).
ஒகுண்ணைக்கே (Ogunnaike)
எழுதிய புக் (book) ப்ரோபைபிளிட்டி
அண்ட் ஸ்டாட்டிஸ்டிக்ஸ்
போர் என்ஜினீர்ஸ்
(probability and statistics for engineers)
அடிப்படையை உங்களுக்கு
வழங்குகிறது.
நீங்கள் ஒரு என்ஜினீயர்(engineer)
இருந்தால், நீங்கள்
புக் (book) பார்த்து
உண்மையில் ஆர்வமாக
இருக்கலாம்.
நிச்சயமாக, நூற்றுக்கணக்கான
புக் (book)கள் உள்ளன.
எனவே, வட்டம் நீங்கள்
விரிவுரையை அனுபவித்து,
குறைந்தபட்சம் டேட்டா
அனாலிசிஸ் (Data Analysis)

Hindi: 
में से सर्वोत्तम
प्रयास करने का प्रयास
करें।
ये कुछ संदर्भ हैं।
बेशक, यह कोई रास्ता
नहीं है।
मैंने इन पुस्तकों
से कुछ उदाहरण और
कुछ सामग्री ली है;
ये काफी आम किताबें
हैं जिनके बारे में
आपको यादृच्छिक डेटा
विश्लेषण (DATA ANALYSIS)पर
पहली पुस्तक मिल
सकती है, जो आपके लिए
बहुत उपयोगी है क्योंकि
यह उन लोगों द्वारा
लिखी गई है जिन्होंने
30-40 वर्षों तक अभ्यास
किया है, विभिन्न
प्रकार के डेटा देखे
हैं, और उनके पास उदाहरण
हैं, उनकी पाठ्य पुस्तकों
में बहुत अच्छे उदाहरण
हैं।
और शेष तीन, कम से
कम जॉनसन और मोंटगोमेरी
और रूंगर की किताब,
वे संभावना और आंकड़ों
में शास्त्रीय किताबें
हैं - लागू संभावना
और आंकड़े।
ओगुननाइक की पुस्तक
आपको इंजीनियरों
के लिए संभावना और
आंकड़ों के मूलभूत
सिद्धांत प्रदान
करती है।
यदि आप एक इंजीनियर
हैं, तो आप पुस्तक
को देखने में वास्तव
में रुचि रखते हैं।
बेशक, सैकड़ों अन्य
किताबें हैं जिन्हें
आप संदर्भित कर सकते
हैं।
तो, उम्मीद है कि आपने
व्याख्यान का आनंद
लिया है और आप कम से
कम डेटा विश्लेषण

Marathi: 
पावले उचलू शकतात
आणि आपण डेटा विश्लेषणात
किती सावध असणे आवश्यक
आहे, पद्धतशीर पद्धत
कोणती आहे आणि काही
परिभाषा आम्ही आर
मध्ये दोन उदाहरणे
स्पष्टपणे पाहू आणि
ते कदाचित या व्याख्यानाचे
पूरक करेल. धन्यवाद.

Kannada: 
ನಂತರ, ನೀವು ಮಾಡಬೇಕಾದ
ಇತರ ರೀತಿಯ ಪೂರ್ವ
ಪ್ರಕ್ರಿಯೆ.
ಉದಾಹರಣೆಗೆ, ನೀವು
ಬಹುಕಾರ್ಯ ಪ್ರಕ್ರಿಯೆಗಳಲ್ಲಿ
ಸಮಯ ಅಂಚೆಚೀಟಿಗಳನ್ನು
ಸಿಂಕ್ ಮಾಡಬೇಕಾಗಬಹುದು;
ಅಲ್ಲಿ ನೀವು ವಿಭಿನ್ನ
ಅಸ್ಥಿರಗಳಿಂದ ಸಂಗ್ರಹಿಸಿದಾಗ,
ನೀವು ಸಮಯ ಅಂಚೆಚೀಟಿಗಳನ್ನು
ಸಿಂಕ್ ಮಾಡಬೇಕಾಗಬಹುದು
ಅಥವಾ ಕೆಲವೊಮ್ಮೆ ಒಂದು
ವೇರಿಯೇಬಲ್ ಅನ್ನು
ಒಂದು ಮಾದರಿ ದರದಲ್ಲಿ
ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ,
ಮತ್ತೊಂದು ವೇರಿಯಬಲ್
ಅನ್ನು ಮತ್ತೊಂದು ಮಾದರಿ
ದರದಲ್ಲಿ ಸಂಗ್ರಹಿಸಲಾಗುತ್ತದೆ,
ನಂತರ ನೀವು ಪೂರ್ವ-ಪ್ರಕ್ರಿಯೆಯನ್ನು
ಹೇಗೆ ನಿರ್ಣಯಿಸಬೇಕು.
ಕೆಲವೊಮ್ಮೆ, ಅನೇಕ
ಬಾರಿ ಡೇಟಾವು ಶಬ್ಧದಿಂದ
ಬರುತ್ತದೆ ಮತ್ತು ನಾವು
ವಿಶ್ಲೇಷಣೆಯಾಗಿ ತೆಗೆದುಕೊಳ್ಳಬಹುದಾದ
ಯಾವುದೇ ಹಂತಕ್ಕೆ ಮುಂಚಿತವಾಗಿ
ಶಬ್ದವನ್ನು ನಾವು ತೆಗೆದುಹಾಕಬೇಕಾಗಬಹುದು,
ಏಕೆಂದರೆ ಶಬ್ದವು ನಾವು
ಸೆಳೆಯುವಂತಹ ಅನ್ವಯಗಳನ್ನು
ಅಪಹರಿಸಬಹುದು.
ಇದು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ
ಕೋರ್ಸ್ಗೆ ಗಮನಾರ್ಹವಾಗಿ
ಪರಿಣಾಮ ಬೀರಬಹುದು.
ಆದ್ದರಿಂದ, ನಾವು ಶಬ್ದವನ್ನು
ಫಿಲ್ಟರ್ ಮಾಡಲು ಬಯಸಬಹುದು.
ಆದ್ದರಿಂದ, ನೀವು ಈ
ಪ್ರಾಥಮಿಕ ಹಂತದಲ್ಲಿ
ಸಮಯವನ್ನು ಕಳೆಯಲು
ಬಯಸುವ ಕಾರಣಗಳು ಬಹುಶಃ
ಬಹು ಮುಖ್ಯವಾದವು.
ಕೆಲವು ಬಿಟ್ ... ಅದರಲ್ಲಿ
ಭಾಗಿಯಾಗಿರುವ ಸ್ವಲ್ಪ
ಮಂದಗತಿಯಿದೆ.
ಇದು ನಿಜವಾಗಿಯೂ ನಿಮ್ಮ
ನರಗಳಿಗೆ ಹೋಗಬಹುದು
ಮತ್ತು ಒಟ್ಟಾರೆ ಮಾಹಿತಿ
ವಿಶ್ಲೇಷಣೆಗೆ ತೆಗೆದುಕೊಳ್ಳುವ
100 ಪ್ರತಿಶತದಷ್ಟು ಸಮಯವನ್ನು
ಹೇಳುವ ಒಂದು ಸುವರ್ಣ
80/20 ನಿಯಮವಿದೆ, ನೀವು
ಡೇಟಾವನ್ನು ಪೂರ್ವ-ಸಂಸ್ಕರಣೆಗೆ
80 ಶೇಕಡಾ ಸಮಯವನ್ನು
ಕಳೆಯಬೇಕಾಗಿರಬಹುದು
. ಅದು ಕೆಲವೊಮ್ಮೆ ನೀವು
ಮಾಡಬೇಕಾಗಿರುವ ರೀತಿಯ
ಪ್ರಯತ್ನವಾಗಿದೆ.
ನೀವು ಅದೃಷ್ಟವಂತರಾಗಿದ್ದರೆ,
ಈ ಹಂತದ ಮೂಲಕ ಗಾಳಿಯಲ್ಲಿ
ಹಾದು ಹೋಗಬಹುದು.
ನಂತರ, ನಿಮ್ಮ ವಿಶ್ಲೇಷಣೆಯ
ಪ್ರಮುಖ ಭಾಗವು ಮಾಡೆಲಿಂಗ್
ಅಥವಾ ಅಂದಾಜು ಅಥವಾ
ಪರಿಶೋಧನೆಯಲ್ಲಿ ಬರುತ್ತದೆ
ಅಥವಾ ಭವಿಷ್ಯಸೂಚಕ
ರೀತಿಯದ್ದಾಗಿರಬಹುದು
ಅಥವಾ ವಿಶ್ಲೇಷಣಾತ್ಮಕ
ರೋಗನಿರ್ಣಯವನ್ನು
ಸೂಚಿಸುವ ರೀತಿಯದ್ದಾಗಿರುತ್ತದೆ
ಮತ್ತು ಇದರಿಂದಾಗಿ
ಹಲವು ಫೀಡ್ಗಳಾದ ಮೇಲ್ವಿಚಾರಣೆ,
ನಿಯಂತ್ರಣ, ಆಪ್ಟಿಮೈಸೇಶನ್
, ನಾವು ಮೊದಲೇ ಚರ್ಚಿಸಿದಂತೆ
ನಾವೀನ್ಯತೆಗಳು.
ಈಗ, ಬಹಳ ಮುಖ್ಯವಾಗಿ,
ಈ ಎಲ್ಲಾ ಹಂತಗಳಲ್ಲಿ,
ನೀವು ಎರಡು ವಿಷಯಗಳನ್ನು
ನೆನಪಿನಲ್ಲಿಟ್ಟುಕೊಳ್ಳಬೇಕು.
ಒಂದು ಬಾಣಗಳು ಸೂಚಿಸುವಂತೆ
ಅವುಗಳು ಅಗತ್ಯವಾಗಿ
ಪುನರಾವರ್ತನೆಯಾಗುವುದಿಲ್ಲ.
ಇದರರ್ಥ, ಕೆಲವೊಮ್ಮೆ
ನೀವು ಹಿಂತಿರುಗಬೇಕಾಗಬಹುದು.
ಹಾಗಾಗಿ, ಡೇಟಾ ಗುಣಮಟ್ಟವು
ಕಳಪೆಯಾಗಿದೆ ಎಂದು
ನಾನು ಕಂಡುಕೊಂಡರೆ,
ನನ್ನ ಪ್ರಯೋಗಕ್ಕೆ
ಅಥವಾ ಉತ್ತಮ ಡೇಟಾವನ್ನು
ನೀಡಲು ನನಗೆ ಡೇಟಾವನ್ನು
ನೀಡಿದ ವ್ಯಕ್ತಿಗೆ
ನಾನು ಹಿಂತಿರುಗಬೇಕಾಗಬಹುದು
ಅಥವಾ ನಾನು ಬಯಸುವ
ವೈಶಿಷ್ಟ್ಯಗಳು ಡೇಟಾದಲ್ಲಿ
ಇಲ್ಲ ಎಂದು ನಾನು ಕಂಡುಕೊಳ್ಳಬಹುದು
, ನಾನು ಪ್ರಯೋಗವನ್ನು
ಪುನಃ ಮಾಡಬೇಕಾಗಬಹುದು
ಅಥವಾ ಅಂದಾಜು ಮಾಡಿದ
ನಂತರ ಡೇಟಾ ಗುಣಮಟ್ಟವು
ಸಾಕಷ್ಟು ಉತ್ತಮವಾಗಿಲ್ಲ
ಅಥವಾ ನಾನು ಪೂರ್ವ-ಸಂಸ್ಕರಣೆಯನ್ನು
ಸಾಕಷ್ಟು ಮಾಡದೆ ಇದ್ದೇನೆ
ಎಂದು ನಾನು ಲೆಕ್ಕಾಚಾರ
ಮಾಡಿದ್ದೇನೆ, ನಾನು
ಹಿಂದಕ್ಕೆ ಹೋಗಬೇಕಾಗಬಹುದು.
ಅದು ಮೊದಲ ಹಂತವಾಗಿದೆ.
ಮತ್ತು ಎರಡನೇ ಪಾಯಿಂಟ್
ನಿಮಗೆ ಯಾವುದೇ ಡೊಮೇನ್
ಜ್ಞಾನವನ್ನು ಹೊಂದಿದ್ದರೆ,
ಅದು ತುಂಬಾ ಮುಖ್ಯವಾಗಿದೆ;
ನಿಸ್ಸಂಶಯವಾಗಿ, ಡೇಟಾವನ್ನು
ಎಲ್ಲಿಂದ ಬರುತ್ತಿದೆ,

Gujarati: 
સામેલ નિદાન અને
ઉપચારાત્મક વસ્તુ
બનશે. તેથી, દેખીતી
રીતે, વિવિધ પ્રકારના
એનાલિસિસ(analysis)નો સંપૂર્ણ
યજમાન છે જે સામેલ
છે અને ત્યાં ઘણી
અન્ય વર્ગીકરણો છે
જે મેં સૂચિબદ્ધ
કર્યા નથી. ખાસ કરીને,
સારા પ્રારંભિક પોઈન્ટ
શોધખોળ અને વર્ણનાત્મક
એનાલિસિસ(analysis) છે
અને તે પછી ત્યાંથી
આગળ વધે છે; જો તમે
નક્કી કર્યું હશે
કે તમે આગાહીઓ માટે
એક મોડેલ બનાવશે
અને તેથી આગળ, તે ભલામણ
કરવામાં આવે છે કે
તમે ડેટાને શોધશો,
તમે ડેટા સાથે મિત્રો
બનાવો છો અને તમે
મોડેલ વિકસાવવા આગળ
વધતાં પહેલાં ડેટા
સાથે જાતે પરિચિત
થાઓ છો. , દાખ્લા તરીકે.
હવે, સામાન્ય રીતે,
એનાલિસિસ(analysis)નો ઉદ્દેશ
ચોક્કસ પ્રકારના
એનાલિસિસ(analysis)ને આપણે
અહીં સૂચિબદ્ધ કર્યા
છે તે નક્કી કરે છે,
તે તમે બહાર જશો. એનો
મતલબ એ કે અનિવાર્યપણે
એનાલિસિસ(analysis)નો અંતિમ
ઉપયોગ શું છે, તમે
કઈ માહિતીનો ઉપયોગ
કરો છો તે તમે કેવી
રીતે ઉપયોગ કરી રહ્યા
છો?
અને આપણે ડેટા એનાલિસિસ(data
analysis) તરફ આગળ વધતા
પહેલા, ઉપલબ્ધ વિવિધ
પ્રકારના ડેટા શું
છે તે જાણવું ખૂબ
ઉપયોગી બની શકે છે,
કારણ કે મુખ્યત્વે
હું પાછળથી ઉલ્લેખ
કરું છું, સાધનો, અર્થઘટન
અને ઘણાં અન્ય પગલાં
ડેટાના પ્રકાર પર
આધાર રાખે છે. હવે,
ફરી એકવાર, જ્યારે
તમે ડેટા એનાલિસિસ(data
analysis)ના સાહિત્યને
ચાલુ કરો છો, ત્યારે
તમને વિવિધ પ્રકારના
વર્ગીકરણ મળશે, સંખ્યાબંધ
વર્ગીકરણો અસ્તિત્વમાં
છે. દાખલા તરીકે, તમને
સંખ્યાત્મક શ્લોક
નિશ્ચિત વર્ગીકરણ
અથવા સ્થિર શ્લોક
ગતિશીલ અને વધુ પર
મળી શકે છે, પરંતુ
હું ખરેખર તે વિશે
વાત કરવા જઈ રહ્યો
નથી, કારણ કે તે ચોક્કસપણે
મહત્વનું છે, પરંતુ
વધુ મહત્વનું છે
કે જે લોકો ઘણીવાર
અવગણના કરે છે, ઓછામાં
ઓછા નવા નિશાળીયા
દ્વારા ડેટાનું એનાલિસિસ(analysis)
વારંવાર અવગણવામાં
આવે છે, તે ડીટર્મીનીસ્ટિક
વિરૃદ્ધ રેન્ડમ અથવા
સ્ટોકેસ્ટિક ડેટાનું(deterministic
verses random or stochastic data) વર્ગીકરણ
છે. તે ખૂબ જ અગત્યનું
છે, કારણ કે સૈદ્ધાંતિક
પોતે અથવા સિદ્ધાંત
પોતે મોટેભાગે જુદા
જુદા સમયે તમને કહે
છે કે ડેટા નિર્ધારિત
પાઠો સ્ટોચેસ્ટિક(stochastic)
પ્રક્રિયામાંથી
બહાર આવે છે. હવે,
અલબત્ત, કેટલાક લોકો
રેન્ડમ શબ્દનો ઉપયોગ
કરે છે. રેન્ડમ અને
સ્ટોકેસ્ટિક(random and
stochastic) વચ્ચે સૂક્ષ્મ
તફાવત છે; તેમ છતાં,
અમે અહીં તે તફાવતનું
પાલન નહીં કરીએ. કેટલીકવાર,
અનડીટર્મીનીસ્ટિક
(undeterministic) શબ્દનો ઉપયોગ
કરવામાં આવે છે. આ
વર્ગીકરણ કે ભેદને
શા માટે મહત્વપૂર્ણ
છે તે પૂછવા પહેલાં,
ચાલો આપણે વ્યાખ્યાઓ
જોઈએ અને વ્યાખ્યાઓ
ડેટા જનરેટિંગ(data
generating) પ્રક્રિયા પર
આધારિત છે. તેથી, નિર્ધારિત
અને સ્ટોકેસ્ટીક
ક્વોલિફાયર(stochastic
qualifier) માહિતી પ્રત્યેક
માહિતી માટે નથી,
વાસ્તવમાં તે પ્રક્રિયા
માટે ક્વોલિફાયર(qualifier)
છે જે ડેટા પેદા કરે
છે. ડેટા એનાલિસિસ(data
analysis)માં, ડેટા જનરેટિંગ(data
generating) પ્રક્રિયા એ
ખૂબ મહત્વપૂર્ણ વસ્તુ

Tamil: 
என்ன என்பதைப் புரிந்து
கொள்ளுங்கள், என்ன
முன்னெச்சரிக்கை
நடவடிக்கைகளை எடுக்க
வேண்டும், டேட்டா
அனாலிசிஸ் (Data Analysis)வைக்
கவனிக்க வேண்டும்,
திட்டமிட்ட நடைமுறை
என்ன, மற்றும் சில
டெர்மினாலஜி (terminology)
ஆகியவை குறித்து
நீங்கள் கவனமாக இருக்க
வேண்டும்.
நாம் ஆர் (R) இல் உள்ள
எடுத்துக்காட்டு
உதாரணங்களை விரைவில்
பார்ப்போம், மேலும்
இந்த சொற்பொழிவை
சேர்ப்போம்.
நன்றி.

English: 
you understood at least what is data analysis
all about, what precautionary steps that you
have to take, and how careful you have to
be in data analysis, what is the systematic
procedure, and some terminology. We will quickly
look at a couple of illustrative examples
in R and that will hopefully supplement this
lecture.
Thank you.

Malayalam: 
ജാഗ്രത പാലിക്കല്‍,
എന്തൊക്കെയാണ് സിസ്റ്റമാറ്റിക്
രീതികള്‍, ചില ടെര്‍മിനോളജി
ഇവയെല്ലാം നിങ്ങള്‍
മനസ്സിലാക്കി.
ഞങ്ങള്‍ R ലെ ചിത്രീകരണ
ഉദാഹരണങ്ങള്‍ വളരെ
വേഗത്തില്‍ നോക്കും.
അത് ഈ പ്രഭാഷണത്തിന്
യോജിച്ചതായിരിക്കും,
നന്ദി.

Hindi: 
(DATA ANALYSIS)क्या समझते
हैं, आपको क्या सावधानी
पूर्वक कदम उठाने
हैं, और डेटा विश्लेषण
(DATA ANALYSIS)में आपको कितना
सावधान रहना है, व्यवस्थित
प्रक्रिया क्या है,
और कुछ शब्दावली।
हम जल्द ही आर में
कुछ उदाहरण उदाहरण
देखेंगे और उम्मीद
है कि इस व्याख्यान
को पूरक बनाया जाएगा।
धन्यवाद।

Bengali: 
পরিস্থিতি রয়েছে
যা আপনাকে অনুমান
করতে পারে প্রক্রিয়া
stochastic হতে এবং আপনি
যেখানে খুঁজছেন তথ্য
কারণ অজানা হয় যে
পরিস্থিতি হয়।
সুতরাং, একটি সাধারণ
উদাহরণ হিসাবে, অনুমান,
আমি স্টক মার্কেট
সূচকের পূর্বাভাস
দেখতে পাচ্ছি।
আসলে অনেক প্রভাব
আছে; স্টক মার্কেট
ইনডেক্সের জন্য অনেকগুলি
কারণ রয়েছে।
এখন, দুর্ভাগ্যবশত,
এমনকি যদি আমি কারণ
জানতে পারি, আমি তাদের
পরিমাপ করতে সক্ষম
হব না এবং কখনও কখনও
আমি যথেষ্ট পুরোপুরি
কারণ জানি না তাই
আমি কি করতে পারি?
আমি ইতিহাসের উপর
নির্ভর করি এবং আশা
করি যে ইতিহাসে এর
কিছু খ্যাতি আছে,
এবং আমি ঐতিহাসিক
নিদর্শন এবং সম্পর্ককে
কাজে লাগিয়েছি এবং
তাই, এবং একটি ভবিষ্যদ্বাণী
তৈরি করি, কিন্তু
ভবিষ্যতে এই ভবিষ্যদ্বাণীটি
অবশ্যই সঠিক নয়।
বিন্দু এখানে আমরা
ইতিহাস থেকে দূরে
দূরে, আমরা গ্রহণ
করা যে প্রধান ধারণা
যে এই স্টক মার্কেট
প্রক্রিয়া - যা কিছু
fictating প্রক্রিয়া যা
সূচক তৈরি - র্যান্ডম
প্রকৃতির হয়।
এটি ছুঁড়ে ফেলে,
এটি স্টক মার্কেট
ইন্ডেক্সের যে কোনও
মূল্য নির্ণয় করতে
পারে যার মধ্যে আমি
একটি পর্যালোচনা
করছি।
অনেকগুলি সম্ভাব্যতা
থাকতে পারে যার মধ্যে
একটি ঘটেছে।
আসলে যে ক্ষেত্রে
হতে পারে না।
সত্যিকারের প্রক্রিয়ায়
এভাবে আচরণ করা যায়
না; এটি একটি ধারণা
যা আমি তৈরি করছি,
যাতে তথ্য বিশ্লেষণে
এগিয়ে যাওয়ার জন্য;
এটা খুব, খুব গুরুত্বপূর্ণ।
অন্য কথায়, যখনই
আমি প্রসেসকে স্টোচাস্টিক
বলে মনে করি তখন এটি
একটি প্রথাগত উপায়
বলে মনে হয় যে প্রক্রিয়াটি
সম্পর্কে আমার যথেষ্ট
জ্ঞান নেই।
কিন্তু এমন পরিস্থিতিতে
আছে যেখানে আমার
একটি মিশ্র কেস আছে
- যেখানে আমার কাছে
প্রক্রিয়াটির একটি
অংশ ভাল জ্ঞান আছে
এবং প্রক্রিয়াটির
অন্য অংশটি আমার
বাইরে।
যেখানে আমরা নিয়ন্ত্রক
এবং স্টোকাস্টিক
প্রক্রিয়া একটি
মিশ্রণ আছে।
এবং এটি প্রকৌশল
ক্ষেত্রের মধ্যে
খুব সাধারণ কারণ
একটি শারীরিক প্রক্রিয়া
ভালভাবে বোঝা যায়,
যেমনটি আমরা আগে
আলোচনা করেছি, যেমন
রিএ্যাক্টর উদাহরণে,
কিন্তু সেন্সর বা
অপ্রয়োজনীয় ব্যাঘাতের
কিছু প্রভাব, আমার
নিয়ন্ত্রণের বাইরে
যা কিছু, তাদেরকে
স্টোকাস্টিক হিসেবে
গণ্য করা উচিত শুধু
কারণ আমি সঠিকভাবে
তাদের ভবিষ্যদ্বাণী
করা যাবে না।
সুতরাং, সেখানে আমরা
উভয় নির্ধারিত এবং
stochastic মন্তব্য সঙ্গে
মোকাবিলা করতে হতে
পারে, এবং একটি তত্ত্ব
আছে যে আপনি করতে

Gujarati: 
છે. ડેટા જનરેટિંગ(data
generating) પ્રક્રિયા દ્વારા
અમારે જે અર્થ થાય
છે તે પ્રક્રિયા
છે જે તમે તમારી પ્રાયોગિક
પ્રક્રિયાની સાથે
સાથે ડેટા એકઠી કરી
રહ્યાં છો. તે જ રીતે
તમે પ્રયોગ હાથ ધરવામાં
આવે છે. તેથી, એકસાથે
મૂકો, બધું ડેટા ઉત્પાદન
પ્રક્રિયા છે. તે
માત્ર ભૌતિક પ્રક્રિયા
જ નથી કે જે તમે એનાલિસિસ(analysis)
કરી રહ્યા છો. તે યાદ
રાખવું ખૂબ જ મહત્વપૂર્ણ
છે કારણ કે બન્ને
ડેટાના પ્રકારમાં
યોગદાન આપે છે જે
તમે જનરેટ કરો છો.
ઉદાહરણ તરીકે, ચાલો
કહીએ, હું કેટલાક
રિએક્ટર તાપમાનનું
નિરીક્ષણ કરું છું
જે શીતક પ્રવાહ દ્વારા
નિયંત્રિત કરવામાં
આવે છે. પરમાણુ રિએક્ટરમાં
આ ખૂબ જ સામાન્ય છે
અને તેથી. હવે, હું
જોઈ રહ્યો છું તે
રીએક્ટર એક ભૌતિક
પ્રક્રિયા છે. ત્યાં
એક નિયંત્રક ત્યાં
તાપમાન નિયંત્રિત
કરવાનો પ્રયાસ કરી
છે અને તેથી પર. ચાલો
કહીએ કે તે તાપમાનને
અંકુશમાં લેવાની
એક વિચિત્ર કામ કરી
રહ્યું છે. તેથી, તાપમાન
તેના સેટ પોઇન્ટ
પર રાખવામાં આવે
છે, પરંતુ સેન્સર(sensor)
જે હું ઉપયોગ કરું
છું તે ખૂબ ઘોંઘાટીયા
હોઈ શકે છે. આખરે,
માહિતી કે જે મારી
પાસે આવે છે તે સીધી
પ્રક્રિયા, ભૌતિક
પ્રક્રિયા અને ડેટા
કે જે મારી પાસે સેન્સર(sensor)
અને સેન્સર(sensor) લાક્ષણિકતાઓ
વચ્ચેની પ્રક્રિયાથી
સીધી નથી. તે સેન્સર(sensor)ની
લાક્ષણિકતાઓ વાસ્તવમાં
ડેટામાં જાય છે સેન્સર(sensor)
ખૂબ ઘોંઘાટીયા છે,
જો, તમે ઘોંઘાટીયા
માહિતી સાથે અંત
જઈ રહ્યા છે. સેન્સર(sensor)
પક્ષપાતી હોય તો,
તમારો ડેટા પૂર્વગ્રહ
બતાવશે.
હવે, ડેટા નિર્માણ
પ્રક્રિયામાં રિએક્ટર
અને સેન્સર (reactor and
sensor)બંનેનો સમાવેશ
થાય છે. ડીજીપી(DGP)
- અમે તમને સાહિત્યમાં
મળશે તે સંક્ષિપ્ત
તરીકે ઉપયોગ કરીશું
-
ડીટર્મીનીસ્ટિક
(deterministic), જો તમે ગાણિતિક
કાર્ય શોધી શકો છો
જે ડેટાને ચોક્કસ
રીતે સમજાવી શકે
છે; એટલે કે, તે ડેટાને
આગાહી કરી શકે છે,
તમે સંપૂર્ણ રીતે
ફિટ થઈ શકો છો, દરેક
ડેટા બિંદુ આ ગાણિતિક
કાર્યની કર્વ પર
આવેલું છે. તે તે જોવાનું
એક રીત છે અથવા તમે
કહી શકો છો કે તમે
બરાબર ડેટા જનરેટિંગ(data
generating) પ્રક્રિયા સમજી
લીધી છે; ત્યાં કંઈ
નથી કે તમે સમજાવી
શકતા નથી કે તમે કહી
શકો છો કે નિરીક્ષણ
થયેલા મૂલ્યોમાં
કોઈ અનિશ્ચિતતા નથી.
તમારી પાસે હોઈ શકે
છે ... ઘણી વખત બને છે
શું તમારી પાસે શારીરિક
પ્રક્રિયાના ખૂબ
સારા જ્ઞાન હોઈ શકે
છે ઉદાહરણ તરીકે,
ઉદાહરણમાં, જે આપણે
અગાઉ ચર્ચા કરી હતી
તે રીએક્ટર, હું ડાયનેમિક્સ,
ગતિવિજ્ઞાન, રિએક્ટરમાં
બધું, થર્મોડાયનેમિક્સ
વગેરેને સમજી શકું
છું, પરંતુ મને સેન્સર(sensor)
લાક્ષણિકતાઓનું
હલકુ જ્ઞાન હોઈ શકે
છે. હવે, તે એક ખૂબ
મુશ્કેલ પરિસ્થિતિ
બનાવે છે તે નૈતિકવાદી
કે સ્ટોકેસ્ટિક(stochastic)
વસ્તુમાં બેસે નહીં
અને અમે તે વિશે વાત
કરીશું, પરંતુ આવશ્યકપણે
તે હવે નિર્ધારક
નથી. ડેટા ડિસ્ટ્રિમિનિસ્ટિક(data
deterministic) પ્રક્રિયાની

Kannada: 
ಅದು ಜೈವಿಕ ಪ್ರಕ್ರಿಯೆ,
ಅರ್ಥಶಾಸ್ತ್ರದ ಪ್ರಕ್ರಿಯೆ
ಅಥವಾ ಎಂಜಿನಿಯರಿಂಗ್
ಪ್ರಕ್ರಿಯೆ ಅಥವಾ ಕೆಲವು
ಸಾಮಾಜಿಕ ಮಾಧ್ಯಮ ಪ್ರಕ್ರಿಯೆಯಿಂದ
ಬರುತ್ತಿದೆ ... ಅಥವಾ
ಒಂದು ರಾಸಾಯನಿಕ ಪ್ರಕ್ರಿಯೆ
ಮತ್ತು ಇನ್ನಿತರ ವಿಷಯಗಳಿಂದ
ಬರುತ್ತಿದೆ ಎಂಬುದನ್ನು
ನೀವು ತಿಳಿದುಕೊಳ್ಳಬೇಕು.
ನಿಮ್ಮ ಮಾಹಿತಿಯ ಮಾದರಿ
ದರ ಯಾವುದು ಎಂಬುದನ್ನು
ಆಯ್ಕೆಮಾಡುವುದರಲ್ಲೂ
ಸಹ ಆ ಜ್ಞಾನವನ್ನು
ಪ್ರತಿಯೊಂದು ಹಂತದಲ್ಲಿಯೂ
ಪರಿಗಣಿಸಬೇಕು - ಅದು
ಎಷ್ಟು ಸಮಯದಲ್ಲಾದರೂ
ನೀವು ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಬೇಕು;
ಅಲ್ಲಿಯೇ ನಿಮ್ಮ ಡೊಮೇನ್
ಜ್ಞಾನದ ಪ್ರಯಾಣ ಪ್ರಾರಂಭವಾಗುತ್ತದೆ.
ಮತ್ತು ನಾನು ತಿಳಿದಿದ್ದರೆ,
ಉದಾಹರಣೆಗೆ, ನಾನು
PH ವ್ಯವಸ್ಥೆಯನ್ನು
ನೋಡುತ್ತಿದ್ದೇನೆ,
ಅದು ಒಂದು ರೇಖಾತ್ಮಕವಲ್ಲದ
ವ್ಯವಸ್ಥೆಯನ್ನು ಸರಿಯಾಗಿ
ತಿಳಿದಿದೆ.
ನಂತರ ಮಾಡೆಲಿಂಗ್ ಹಂತದಲ್ಲಿ,
ನಾನು ರೇಖಾತ್ಮಕ ಮಾದರಿಗಳನ್ನು
ನಿರ್ಮಿಸಲು ಯೋಚಿಸಬಾರದು,
ಆದರೆ ಡೇಟಾ ಎಲ್ಲಿಂದ
ಬರುತ್ತಿದೆ ಎಂದು ನನಗೆ
ತಿಳಿದಿಲ್ಲದಿದ್ದರೆ,
ಅದು ಕೇವಲ ಡೇಟಾ ಸೆಟ್
ಮತ್ತು ಅದರ ಸೀಮಿತ
ಬಳಕೆಯನ್ನು ನನ್ನದಾಗಿ
ಉಳಿದಿದೆ, ಅದರ ಕೆಲವು
ರೀತಿಯ ನಾನು ಸುಮಾರು
ಆಟವಾಡುತ್ತಿರುವ ಆಟಿಕೆ.
ಆದ್ದರಿಂದ, ಡೊಮೇನ್
ಜ್ಞಾನವನ್ನು ಪ್ರತಿ
ಹಂತದಲ್ಲಿಯೂ ಸಾಧ್ಯವಾದಷ್ಟು
ಉತ್ತಮ ರೀತಿಯಲ್ಲಿ
ಬಳಸಬೇಕು ಮತ್ತು ನೀವು
ಎಷ್ಟು ಡೊಮೇನ್ ಜ್ಞಾನವನ್ನು
ಸಂಪೂರ್ಣವಾಗಿ ಅವಲಂಬಿಸಿರುತ್ತೀರಿ.
ಮಾದರಿಯ ರಚನೆಯನ್ನು,
ನೀವು ಹುಡುಕಬೇಕಾದಂತಹ
ವೈಶಿಷ್ಟ್ಯಗಳು ಅಥವಾ
ನೀವು ನಿರೀಕ್ಷಿಸಬಹುದಾದ
ಶಬ್ದದ ಮಟ್ಟವನ್ನು
ಆಯ್ಕೆ ಮಾಡುವಲ್ಲಿ
ಇದು ನಿಮಗೆ ಸಹಾಯ ಮಾಡಬಹುದು
- ಇದು ಸಂವೇದಕ ಶಬ್ದ
ಅಥವಾ ಪ್ರಕ್ರಿಯೆಯ
ಶಬ್ದವಾಗಿದ್ದರೂ ಸಹ,
ಅಥವಾ ನಿಮ್ಮ ಅನ್ವಯಗಳಲ್ಲಿ
. ಆದ್ದರಿಂದ, ಅದು ಮನಸ್ಸಿನಲ್ಲಿಟ್ಟುಕೊಳ್ಳಬೇಕು.
ಪ್ರಕೃತಿಯಲ್ಲಿ ಎಲ್ಲಾ
ಪುನರಾವರ್ತಿತವಾದರೂ,
ಆದರೆ ಅದಕ್ಕೆ ಕೆಲವು
ಸಿಸ್ಟಂಟೈಜಿಮ್ ಇದೆ
- ನಿಮ್ಮ ಮಾದರಿಗಳನ್ನು
ಸರಿಯಾಗಿ ಆಯ್ಕೆ ಮಾಡಿ
ಮತ್ತು ನೀವು ಡೇಟಾ
ಗುಣಮಟ್ಟದ ಪರಿಶೀಲನೆಯ
ಮೂಲಕ ಹೋಗಿ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ;
ಡೇಟಾವನ್ನು ದೃಶ್ಯೀಕರಿಸುವುದು;
ಪೂರ್ವ-ಪ್ರಕ್ರಿಯೆ;
ನಂತರ ನೀವು ಮಾದರಿಗಳನ್ನು
ನಿರ್ಮಿಸುತ್ತಿದ್ದರೆ
ಮತ್ತು ಹೀಗೆ ನಿಮ್ಮ
ಮಾದರಿಗಳನ್ನು ಸರಿಯಾಗಿ
ಆಯ್ಕೆ ಮಾಡಿ. ನಾವು
ಮಾಡೆಲಿಂಗ್ ಕೌಶಲ್ಯಗಳ
ಬಗ್ಗೆ ಮುಂದಿನ ಉಪನ್ಯಾಸದಲ್ಲಿ
ಅಥವಾ ಸರಿಯಾಗಿ ಅಂದಾಜು
ಮಾಡುವ ಬಗ್ಗೆ ಅದರ
ಬಗ್ಗೆ ಮಾತನಾಡುತ್ತೇವೆ.
ಆದ್ದರಿಂದ, ಈಗ ನಾವು
ಸ್ವಲ್ಪ ಹೆಚ್ಚು ವಿಸ್ತರಿಸುತ್ತೇವೆ.
ಆದ್ದರಿಂದ, ನಾವು ಡೇಟಾ
ವಿಶ್ಲೇಷಣೆಗೆ ಮುನ್ನ,
ಮೊದಲ ಹಂತವು, ನಾವು
ಕಲಿತಂತೆ, ಕೆಲವು ಪ್ರಾಥಮಿಕ
ಪ್ರಶ್ನೆಗಳನ್ನು ಕೇಳುವುದು.
ಯಾವ ರೀತಿಯ ವಿಶ್ಲೇಷಣೆ
ಅಗತ್ಯವಿದೆ?
ಇದು ವಿವರಣಾತ್ಮಕ,
ಭವಿಷ್ಯಸೂಚಕ ಮತ್ತು
ಇನ್ನೂ ಆಗಿರಬಹುದು,
ಏಕೆಂದರೆ ಇದು ವಿಶ್ಲೇಷಣೆಯ
ಸಂಪೂರ್ಣ ಪಠ್ಯವನ್ನು
ಬದಲಾಯಿಸುತ್ತದೆ.
ಡೇಟಾ ಎಲ್ಲಿಂದ ಬರುತ್ತವೆ?
ಮಾಹಿತಿಯ ಮೂಲಗಳು - ನಾವು
ಸಮಯವನ್ನು ಕೇಳಿದ್ದೇವೆ,
ನಮಗೆ ಸಮಯ ಡೊಮೇನ್,
ಡೇಟಾ ತರಂಗಾಂತರ ಡೊಮೇನ್,
ಡೇಟಾ ಜೈವಿಕ ಪ್ರಕ್ರಿಯೆ
ಡೇಟಾ ಮತ್ತು ಮುಂತಾದವುಗಳಿವೆ.
ಡೇಟಾವನ್ನು ಹೇಗೆ ಪಡೆದುಕೊಂಡಿದೆ?
ಯಾವ ರೀತಿಯ ಯಂತ್ರಾಂಶವನ್ನು
ಬಳಸಲಾಯಿತು?
ಇದು ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಿದ
ಮಾನವೇ?
ಅದು ಸಂವೇದಕವಾಯಿತೆ?
ಇದು ಸಂವೇದಕವಾಗಿದ್ದರೆ,
ಮಾದರಿ ದರ ಏನು?
ನಾನು ನಿರೀಕ್ಷಿಸಬಹುದಾದ
ಉತ್ತಮ ಗುಣಮಟ್ಟದ ವಿಶ್ಲೇಷಣೆ
ಮತ್ತು ನಾನು ಬಳಸಬೇಕಾದ
ರೀತಿಯ ವಿಶ್ಲೇಷಣಾ

Bengali: 
পারবেন।
অতএব, নিচের লাইনটি
দয়া করে কয়েকটি
মুহুর্তের মধ্যে
ব্যয় করুন - প্রথমত,
আপনি একটি ডিটেক্টিকাল
হিসাবে স্টোকাস্টিক,
Stochastic প্রক্রিয়া
বা একটি মিশ্র প্রক্রিয়া
থেকে বেরিয়ে আসার
জন্য ডেটা ব্যবহার
করতে চান কিনা, এবং
আপনার উত্তরটি কেন
এর সাথে থাকা উচিত
আপনি যে ধারণা তৈরি
করেছেন, বিশ্লেষণ
অবশ্যই যে উপর নির্ভর
করে কারণ।
ঠিক আছে, শুধু জোর
দেওয়া, ডেটা নিখুঁত
হতে অনুমিত হয় কেন
তা স্পষ্ট হতে হবে,
বিশেষত এটি একটি
খুব সাধারণ ধারণা;
আসলে, অনেক গবেষক
ডেটা বিশ্লেষণ করে
ডেটা বিশ্লেষণ করে
স্টকাস্টিক রাখার
জন্য সম্ভবত একটি
মুহূর্তের জন্য বিরতিহীনভাবে
জিজ্ঞাসা করেন কেন
এবং স্টকাস্টিক কী
ধরনের।
আমি স্টকাস্টিক প্রক্রিয়া
থেকে বেরিয়ে আসার
জন্য ডেটা নিরূপণ
করলাম কারণ, আমি কেবল
এগিয়ে যেতে এবং
আমার তথ্য বিশ্লেষণটি
পরিচালনা করতে পারিনি।
স্টোকাস্টিক প্রসেসের
মধ্যে, বেশ কয়েকটি
শ্রেণীবিন্যাস আছে
এবং আমার ধারণাটি
আমার স্পষ্ট হওয়া
উচিত।
এটা সব একটি ধারণা
পরে, কিন্তু এখনও
এটি একটি স্টোরেজ
stochastic প্রক্রিয়া,
অ স্টেশন স্টকাস্টিক
প্রক্রিয়া বা একটি
পর্যায়ক্রমিক stochastic
প্রক্রিয়া এবং তাই
থেকে বেরিয়ে আসছে
কিনা হিসাবে স্পষ্ট
হতে হবে।
সুতরাং, বিভিন্ন
বিভাগ আছে এবং আমাদের
খুব স্পষ্ট হওয়া
উচিত।
এটি হল ... সবগুলিই
নিয়মিত ক্লাসিফিকেশনগুলি
থেকে বাদ দেওয়া
হয়েছে যা আমাদের
চিন্তা করতে হবে
- যা একটি স্থিতিশীল
অবস্থা বা গতিশীল
প্রক্রিয়া থেকে
বেরিয়ে আসছে কিনা,
রৈখিক বা অ-রৈখিক।
সব এখনও ভাল রাখা,
কিন্তু এই আপনি আপফ্রন্ট
তৈরি করতে হবে যে
একটি খুব গুরুত্বপূর্ণ
শ্রেণীবিভাগ।
এবং, সাধারণভাবে,
যদি আপনি পরীক্ষা
অ্যাক্সেস আছে, অবশ্যই,
বিশ্লেষণের বিশদ
বাইরে, কিন্তু এটি
আপনার পরীক্ষা সময়
সম্ভাব্য যদি randomness
উত্স দমন করতে সংশ্লিষ্ট।
এটি একটি অংশ, এটি
এমন একটি বিষয় যা
পরীক্ষার নকশার বিস্তারিত
বিশ্লেষণের মধ্যে
রয়েছে এবং এখানে
আমরা এখানে যাব না।
সবচেয়ে গুরুত্বপূর্ণ
বিষয় যে মানুষ প্রায়ই
আউট মিস - যে beginners - যে
কোন তথ্য বা কোন তথ্য
যে আমি আঁকা থেকে
আঁকা - এবং সাধারণত
অনেক তথ্য র্যান্ডম
বা একটি stochastic প্রক্রিয়া
থেকে বেরিয়ে আসে
বলে অনুমিত হয়; যারা
আনুমানিক হয় অনুমান
প্রকৃতির র্যান্ডম
হয়, কারণ আপনি যে
তথ্যগুলির মধ্যে
অনিশ্চয়তা আছে তার
মধ্যে স্থাপন করছেন।
কিছু প্রক্রিয়া
মাধ্যমে, কিছু সূত্র,
কিছু গাণিতিক প্রক্রিয়া
এবং আপনি বেরিয়ে
আসছেন, উদাহরণস্বরূপ,
আমি নমুনা গড় কম্পিউটিং
করছি।

Kannada: 
ಪರಿಕರಗಳು ಯಾವುದು
ಎಂದು ಹೇಳಲು ಸಾಧ್ಯವಾಗುವಂತೆ
ಅನೇಕ ಪ್ರಶ್ನೆಗಳನ್ನು
ನಾವು ತಿಳಿದಿರಬೇಕಾಗುತ್ತದೆ
ಮತ್ತು ನಾನು ಏನು ಹುಡುಕಬೇಕು.
ಮತ್ತು ನಂತರ, ಸಹಜವಾಗಿ,
ಮಾಹಿತಿ ಹೇಗೆ ಮಾಹಿತಿಯುಕ್ತವಾಗಿದೆ
- ಅದು ಸ್ವಲ್ಪ ಗುಣಾತ್ಮಕವಾಗಿದೆ,
ಆದರೆ ಕೆಲವು ಪರಿಮಾಣಾತ್ಮಕ
ಕ್ರಮಗಳೂ ಸಹ ಇವೆ. ನಾವು
ಅದರ ಬಗ್ಗೆ ಮಾತನಾಡುವುದಿಲ್ಲ,
ಆದರೆ ನಾನು ಹೇಳಿದಂತೆ,
ಮೂಲಭೂತವಾಗಿ ಕಾಣೆಯಾಗಿರುವ
ದತ್ತಾಂಶ ಹೊರಹರಿವುಗಳು
ಮತ್ತು ಇನ್ನೂ ಇಲ್ಲವೇ
ಎಂಬುದನ್ನು ಪರಿಶೀಲಿಸಲು
ಸಂಬಂಧಿಸಿದೆ.
ಮತ್ತು ಕೊನೆಯದಾಗಿ,
ಆದರೆ ಬಹುಶಃ ಅತ್ಯಂತ
ಪ್ರಮುಖವಾದದ್ದು - ಡೇಟಾ
ಉತ್ಪಾದಿಸುವ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ
ಯಾವ ಊಹೆಗಳನ್ನು ಮಾಡಲಾಗುತ್ತಿದೆ
ಎಂಬುದು ಸ್ಪಷ್ಟವಾಗಿರಬೇಕು.
ನೀವು ತಪ್ಪಾಗಿರಬಹುದು.
ಆರಂಭದಲ್ಲಿ, ನಾವು
ತಪ್ಪಾದ ಊಹೆಗಳನ್ನು
ಮಾಡಬಹುದು, ನಾವು ಒಂದು
ಸಂಭವನೀಯ ಪ್ರಕ್ರಿಯೆಯನ್ನು
ನಿರ್ಣಾಯಕ ಎಂದು ಪರಿಗಣಿಸಬಹುದು,
ರೇಖಾತ್ಮಕವಲ್ಲದ ಪ್ರಕ್ರಿಯೆಯೆಂದು
ನಾವು ಊಹಿಸಬಹುದು,
ಸ್ಥಿರವಾದ ಪ್ರಕ್ರಿಯೆ
ಕ್ರಿಯಾತ್ಮಕವಾಗಿದ್ದು
ಹೀಗೆ ಮಾಡುವುದು; ಅದು
ಸಾಧ್ಯ.
ಆದರೆ ನಾವು ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ
ಉದ್ದಕ್ಕೂ ಮಾಡಿದ್ದೇವೆ
ಎಂಬ ಊಹೆಗಳಿಗೆ ನಾವು
ಅಂಟಿಕೊಳ್ಳಬೇಕು ಮತ್ತು
ಸ್ಥಿರವಾದ ಮತ್ತು ಅನುಗುಣವಾಗಿರಬೇಕು
- ಅಂದರೆ ನಾವು ಸರಿಯಾದ
ಸಾಧನಗಳನ್ನು ಆಯ್ಕೆ
ಮಾಡಬೇಕಾಗಿದೆ ಮತ್ತು
ಇದರಿಂದಾಗಿ ನೀವು ತಪ್ಪು
ಮಾಡಿದರೆ, ನಾವು ನಾವು
ತಪ್ಪು ಮಾಡಿದ್ದೇವೆಂದು
ತಿಳಿಯುವುದು.
ತದನಂತರ, ನಾವು ಹಿಂತಿರುಗಿ,
ತಿದ್ದುಪಡಿಗಳನ್ನು
ಮಾಡೋಣ.
ಮತ್ತು ನಾನು ಈ ವಿವರಕ್ಕೆ
ಹೋಗಲು ಹೋಗುತ್ತಿಲ್ಲ.
ನಾವು ಅದರ ಬಗ್ಗೆ ಈಗಾಗಲೇ
ಮಾತನಾಡಿದ್ದೇವೆ.
ಆದ್ದರಿಂದ, ಒಮ್ಮೆ
ನೀವು ಪ್ರಾಥಮಿಕ ಪ್ರಶ್ನೆಗಳ
ಮೂಲಕ, ಅನೇಕ ಡೇಟಾ ಪೂರ್ವ-ಪ್ರಕ್ರಿಯೆ
ಹಂತಗಳ ಮೂಲಕ ನಮ್ಮ
ಡೇಟಾವನ್ನು ಸಿದ್ಧಪಡಿಸುತ್ತೇವೆ;
ದತ್ತಾಂಶವು ಯಾವ ರೀತಿಯ
ಸಮಸ್ಯೆಗಳನ್ನು ಅವಲಂಬಿಸಿದೆ
ಎಂಬುದನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ.
ಉದಾಹರಣೆಗೆ, ಡೇಟಾವು
ಹೊರಗಿನವರಾಗಿದ್ದರೆ,
ಅಂದರೆ, ನಾನು ಸ್ವಚ್ಛಗೊಳಿಸಲು
ಮಾಡಬೇಕು, ಆದರೆ ದೃಢವಾದ
ವಿಧಾನಗಳಿವೆ.
ಹೊರಗಿರುವವರು ಡೇಟಾದಲ್ಲಿ
ಉಳಿಯಲು ಮತ್ತು ಇನ್ನೂ
ಯೋಗ್ಯವಾದ ಅಂದಾಜುಗಳನ್ನು
ಪಡೆಯಲು ಹೋಗುತ್ತೇವೆ
ಮತ್ತು ಹೀಗೆ ನಾವು
ಫಿಲ್ಟರ್ ಮಾಡಬೇಕಾಗಬಹುದು.
ನಾನು ಮೊದಲು ಉಲ್ಲೇಖಿಸದ
ಒಂದು ವಿಷಯವೆಂದರೆ
ಡೇಟಾವನ್ನು ವಿಭಜಿಸುವುದು.
ನೀವು ಒಂದು ಮಾದರಿಯನ್ನು
ನಿರ್ಮಿಸುತ್ತಿದ್ದರೆ
ಅಥವಾ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು
ಹೊರತೆಗೆಯುವುದರ ಮೂಲಕ
ವರ್ಗೀಕರಣವನ್ನು ನಿರ್ವಹಿಸುತ್ತಿದ್ದರೆ
ಮತ್ತು ಯಾವಾಗಲೂ, ಅಡ್ಡ
ಊರ್ಜಿತಗೊಳಿಸುವಿಕೆಗಾಗಿ
ನೀವು ಯಾವಾಗಲೂ ಡೇಟಾದ
ಒಂದು ಭಾಗವನ್ನು ಹೊಂದಿರಬೇಕು.
ನಾವು ಡೇಟಾದಲ್ಲಿ ತರಬೇತಿ
ಪಡೆದ ಮಾದರಿಯನ್ನು
ತೆಗೆದುಕೊಳ್ಳಬೇಕು
ಮತ್ತು ಇದು ಒಂದೇ ರೀತಿಯ
ಪ್ರಾಯೋಗಿಕ ಪರಿಸ್ಥಿತಿಗಳಿಂದ
ಹೊರಬಂದ ಹೊಸ ಡೇಟಾವನ್ನು
ಪರೀಕ್ಷಿಸಲು ಅಥವಾ
ತರಬೇತಿಯ ಡೇಟಾವನ್ನು
ಆಧರಿಸಿ ನಾವು ವರ್ಗೀಕರಣವನ್ನು
ರಚಿಸಿದ್ದರೆ, ನಾವು
ವರ್ಗ ವರ್ಗೀಕರಣವನ್ನು
ನಾನು ನವೀಕರಿಸಿದ ಡೇಟಾ
ಸೆಟ್. ಆದ್ದರಿಂದ, ಯಾವಾಗಲೂ
ಅಡ್ಡ ಊರ್ಜಿತಗೊಳಿಸುವಿಕೆಯ
ಡೇಟಾದ ಭಾಗವನ್ನು ಇರಿಸಿಕೊಳ್ಳಿ.
ಮತ್ತು ಕೆಲವೊಮ್ಮೆ
ಇತಿಹಾಸಕಾರರಿಂದ ಬರುವ
ಡೇಟಾದಲ್ಲಿ ಉಂಟಾಗಬಹುದಾದ
ಪರಿಮಾಣದ ದೋಷಗಳು ಅಥವಾ
ಸಂಕುಚನ ದೋಷಗಳನ್ನು
ನಿರ್ಣಯಿಸಲು ಅಗತ್ಯವಾಗಬಹುದು.
ಈ ದಿನಗಳು ಅದು ಕೆಟ್ಟದ್ದಲ್ಲ,
ಆದರೆ ನೀವು ಡೇಟಾವನ್ನು
ನೋಡುತ್ತಿದ್ದರೆ 10
ವರ್ಷಗಳ ಹಿಂದೆ ಇರಬಹುದು,
ಮತ್ತು ಅವುಗಳು ಹೆಚ್ಚು
ಪ್ರಮಾಣದಲ್ಲಿ ಅಥವಾ

Gujarati: 
બહાર આવતા નથી કારણ
કે ડીજીપી(DGP)નો એક
ભાગ, જે સેન્સર(sensor)
છે, તેને યોગ્ય રીતે
સમજી શકાયું નથી.
સામાન્ય રીતે, આ પરિસ્થિતિ
છે; સેન્સર(sensor) સંપૂર્ણપણે
સમજી શકાયું નથી.
તમે ઘણું ઓછું ઘોંઘાટ
ધરાવતા ખૂબ, ખૂબ સરસ
સેન્સર(sensor) ડિઝાઇન
કરી શકો છો, પરંતુ
કોઈ સેન્સર(sensor) સંપૂર્ણ
નથી અને કોઈ સેન્સર(sensor)
ખરેખર સંપૂર્ણપણે
સમજી શકતું નથી. તેથી
વાસ્તવમાં, એક ડીટર્મીનીસ્ટિક
(deterministic) પ્રક્રિયા
જેવું કશું જ નથી.
તે આદર્શવાદ છે, જે
ડેટા એનાલિસિસ( data
analysis)માં ખૂબ જ ઉપયોગી
છે અને સિદ્ધાંતના
વિકાસમાં છે. હવે,
દેખીતી રીતે, સ્ટોકેસ્ટિક(stochastic)
એ ડીટર્મીનીસ્ટિક
(deterministic) માટે કાઉન્ટરનો
ભાગ છે, જ્યાં અમે
કહીએ છીએ કે ડીજીપી(DGP)ચોક્કસપણે
ધારી શકાતો નથી અથવા
તે જાણતી નથી અથવા
તમે કહી શકો છો કે
ડેટામાં અનિશ્ચિતતા
છે અને તેથી. અને મેં
કહ્યું, વ્યવહારમાં,
સંપૂર્ણ જ્ઞાન નક્કી
નથી કારણ કે કોઈ પ્રક્રિયા
નક્કી નથી. હવે, શું
તેનો મતલબ એવો થાય
છે કે દરેક ડેટા જનરેટિંગ(data
generating) પ્રક્રિયા સ્ટોકેસ્ટિક(stochastic)
તરીકે ગણવામાં આવે
છે?
ખરેખર નથી નિશ્ચિત
અને સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયાઓ વચ્ચે
હજુ પણ જોવા મળેલ
વિશિષ્ટ તફાવત છે,
ભલે તે કોઈ પ્રક્રિયાની
સંપૂર્ણ આગાહી કરતું
ન હોય. ખાસ કરીને,
અમે કહીએ છીએ કે પ્રક્રિયા
મુખ્યત્વે નિર્ધારિત
અથવા મુખ્યત્વે સ્ટોકેસ્ટિક(stochastic)
છે અને અમે તે વિશે
ટૂંક સમયમાં જ વાત
કરીશું; અહીં આ સ્લાઇડ
પછી તરત.
તેથી, આપણે પહેલાં
ઉકેલા પ્રશ્ન પર
પાછા જવાનું - શા માટે
મને ચિંતા છે કે ડેટા
ડીટર્મીનીસ્ટિક
(deterministic) અથવા સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયાનો છે?
શા માટે આ ધારણા એટલી
મહત્વપૂર્ણ છે?
હવે, જવાબ એ કંઈક છે
જે મેં અગાઉ કહ્યું
છે - તે સિદ્ધાંત,
એનાલિસિસ(analysis)નું
સાધન અને પરિણામોના
અર્થઘટન આ ધારણાઓ
પર નોંધપાત્ર રીતે
આધાર રાખે છે. અને
ઘણા, ઘણા ઉદાહરણો
છે જે એક આપી શકે છે.
દાખલા તરીકે, જો હું
સમયાંતરે તપાસ શોધી
રહ્યો હોઉં, તો પહેલા
મને વ્યાખ્યાયિત
કરવું પડશે કે સામયિક
નિર્ધારિત સંકેત
શું છે. જો હું ડીટર્મીનીસ્ટિક
(deterministic) માહિતી જોઈ
રહ્યો છું, અને જો
હું સ્ટોકેસ્ટિક(stochastic)
ડેટા પર નજર કરું
છું, તો પછી મને વ્યાખ્યાયિત
કરવી પડશે કે સામયિક
રેન્ડમ પ્રક્રિયાનો
અર્થ શું છે. તેથી,
વ્યાખ્યાઓ અલગ અલગ
હોય છે, અને તેથી જ
અધિકાર, અર્થઘટન
પણ બદલાશે.
તેવી જ રીતે, જ્યારે
હું સ્ટોકેસ્ટિક(stochastic)
સિગ્નલની સરેરાશની
વાત કરી રહ્યો છું,
સામાન્ય રીતે ગેરસમજ
એ નમૂનાનો અર્થ છે,
જે એનો અર્થ એ છે કે
અવલોકનોમાંથી ગણતરી
કરવામાં આવે છે, તેને
પ્રક્રિયાના અર્થ
તરીકે ગણવામાં આવે
છે; તે એ સાચું નથી.
નમૂનાનું અર્થ એ
સાચું અર્થનું માત્ર
અંદાજ છે જે અલગ રીતે
વ્યાખ્યાયિત થયેલ
છે અને અમે તેના વિશે
ઝડપથી વાત કરીશું.
તેથી, નીચે લીટી અહીં
છે, તમે સરેરાશ વેરિઅન્ટ્સ

Bengali: 
আমি একটি সেন্সর
দিয়ে ডেটা, পরিবেষ্টিত
তাপমাত্রা ডেটা সংগ্রহ
করি এবং সংগ্রহ করি।
আমার ডেস্কটপে ফিরে
যান এবং আমার কম্পিউটার
বা আমার ক্যালকুলেটরে
ডেটাতে ফিড করুন
এবং আমি আসলে নমুনা
গড় হিসাব করি।
নমুনা মানে যে আমি
গণনা করা হয় কেবল
গড়; গড় কি?
যে তথ্যগুলি অনিশ্চয়তার
সাথে দূষিত সুতরাং,
যারা অনিশ্চয়তা
এছাড়াও আপনার নমুনা
গড় মাধ্যমে তাদের
পথ তৈরি করেছে।
সুতরাং, নমুনা মান
মানে আপনি কিছু অনিশ্চয়তা
আছে।
এখানে অনিশ্চয়তা
আপনার গণনা ভুল ঠিক
আছে না; যে সরাইয়া
রাখা উচিত এটির অনিশ্চয়তাটি
এমন একটি সত্যের
সাথে মিলিত হয়েছে
যে আপনি নিশ্চিত
নন যে এটি প্রক্রিয়াটির
প্রকৃত অর্থ কিনা;
এটা অনিশ্চয়তা।
যে আবার আপনি যে সংগৃহীত
তথ্য আছে কারণ .. আছে
অনেক সম্ভাব্য তথ্য
সেট এক যে আপনি সংগ্রহ
করতে পারে।
সুতরাং, আপনি একটি
নমুনা মানে যা অনেক
সম্ভাব্য নমুনা এক
যে আপনি প্রাপ্ত
হতে পারে।
এবং যে কোন
প্যারামিটার অনুমানের
জন্য এটি সত্য যে
আপনি ঢাল, অন্তর্বর্তী
বা অন্য কোন সম্পর্ক,
অন্য কোন জটিল প্যারামিটার
অনুমান করছেন কিনা
তা স্টচাস্টিক ডেটা
থেকে অনুমান করা
যেতে পারে, আপনাকে
মনে রাখতে হবে যে
ডেটাতে ত্রুটি আছে
এবং বিশ্লেষক, এটি
বিশ্লেষকের দায়বদ্ধতা
বা অনুমানের আকৃতি
অথবা অনিশ্চয়তার
পরিমাপের অনুমান
বা পরিমাপের পরিমাপের
দায়িত্ব।
এটা ডাটা বিশ্লেষণের
একটি গুরুত্বপূর্ণ
অংশ।
এবং এই প্রসঙ্গে,
আপনাকে একটি মূল্যায়ন
পদ্ধতি নির্বাচন
করা উচিত যা আপনাকে
যতটা সম্ভব ছোট ত্রুটির
সাথে একটি অনুমান
প্রদান করে এবং আমরা
বিস্তারিতভাবে এটি
সম্পর্কে আরো বিস্তারিতভাবে
আলোচনা করব।
আরো গুরুত্বপূর্ণ
যে আপনি যত বেশি পর্যবেক্ষণ
সংগ্রহ করবেন ততই
আপনার অনুমানের ত্রুটিটি
সঙ্কুচিত হওয়া শুরু
করা উচিত এবং অশিক্ষিতভাবে
শূন্যের দিকে যেতে
হবে যেমন n অনন্ত হতে
চলেছে।
সুতরাং, এই কিছু মানদণ্ড
এবং প্রায়ই অনেক
গবেষক এই সচেতন হতে
পারে না।
সুতরাং, আমরা এই বিশ্লেষণের
শেষ অংশ যা ডেটা বিশ্লেষণ
পদ্ধতিতে অগ্রসর
হওয়ার আগে, এটি অন্তত
কিছু পরিভাষার সাথে
পরিচিতি অর্জন করা
গুরুত্বপূর্ণ যেটি
সাধারণত ডেটা বিশ্লেষণ
সাহিত্যে পাওয়া
যায় এবং এখানে, আমরা
মূলত অনুমান করা
হবে যে আমরা একটি
নন-নির্ধারক প্রক্রিয়া
থেকে আসে যে তথ্য
মোকাবেলা করতে যাচ্ছি,
কারণ যে সর্বত্র
প্রচলিত পরিস্থিতি।
এমনকি যদি আপনার
নিয়ন্ত্রক এবং স্টোকাস্টিক
প্রক্রিয়ার মিশ্রণ
থাকে তবে এই পরিভাষাগুলি
প্রয়োগ করে।
সুতরাং, প্রথম পরিভাষাটি
আমাদের সাথে পরিচিত

Gujarati: 
અથવા સિગ્નલની કોઈપણ
અન્ય લાક્ષણિકતા
જોઈ રહ્યા છો, તો તમારે
ખરેખર પુસ્તકોમાં
પાછા જવું પડશે અને
પૂછો કે હું જે સંકેત
શોધી રહ્યો છું તે
કેવી રીતે વ્યાખ્યાયિત
કરવામાં આવે છે. જો
હું એક ડીટર્મીનીસ્ટિક
(deterministic) સંકેત શોધી
રહ્યો છું - સામયિકની
વ્યાખ્યા શું છે?
અર્થ શું વ્યાખ્યા
છે?
જો હું સ્ટોકેસ્ટિક(stochastic)
સિગ્નલ જોઈ રહ્યો
છું - તો વ્યાખ્યા
શું છે?
અને પછી માત્ર, તમે
અર્થપૂર્ણ અર્થઘટન
કરી શકો છો. અને ખૂબ,
ખૂબ જ સામાન્ય પરિસ્થિતિ
પાવર સ્પેક્ટરલ(power
spectral) ઘનતા જેનો સમયાંતરે
ઓળખાણ માટે ઉપયોગમાં
લેવાય છે અને તેથી.
કોઈપણ રીતે, અમે આટલી
બધી વિગત આપતા નથી,
પરંતુ તમારે આ હકીકત
યાદ રાખવી જોઈએ, અને
દર વખતે જ્યારે તમે
ડેટા એકત્રિત કરો
છો અને તમે બેસો છો
ત્યારે ડેટાને એનાલિસિસ(analysis)
કરવા માટે કેટલાક
મહત્વપૂર્ણ પ્રશ્નો
પૂછો, અને તેમાંથી
એક પ્રશ્ન છે - હું
શું ધારણાઓ કરી રહ્યો
છું માહિતી પેદા
કરવાની પ્રક્રિયા
તેથી, આપણે શીખવા
માટે આગળ વધીએ છીએ
કે ડેટા એનાલિસિસ(
data analysis)માં સામાન્ય
રીતે અનુસરવામાં
આવતી કાર્યવાહી શું
છે, આ પ્રશ્ન સાથે
ડિટેટિકિસ્ટિક અથવા
સ્ટોકેસ્ટિક(stochastic)
પર આ ચર્ચા બંધ કરવાનું
ફરી સારું છે - ક્યારે
અમે ડીજીપી(DGP) ને ધારે
છે ડીટર્મીનીસ્ટિક
(deterministic) અથવા સ્ટોકેસ્ટિક(stochastic)
હોવું જોઈએ?
શું કોઈ આવીને મને
કહે છે?
દેખીતી રીતે નહીં.
શું હું સાહિત્યમાં
શોધી શકું છું?
હા, હા, પરંતુ તે પ્રક્રિયા
માટેના મોટાભાગના
વખત નહીં કે જેને
હું જોઈ રહ્યો છું.
તેથી, શું એક પ્રાયોરી
ખબર માર્ગ છે?
સારું, કમનસીબે, તમારા
માટે એક આદર્શ ફોર્મ્યુલા
છે કે તે આકૃતિ છે
કે શું ડેટાત્મક
અથવા સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયામાંથી
માહિતી આવી રહી છે;
પરંતુ તમને ખબર નથી
કેટલી તમને ખબર છે
કેટલી તમને ખબર નથી.
તે પ્રક્રિયા વિશે
છે તેથી, ઉદાહરણ તરીકે,
માની લો કે હું એક
રૂમમાં, એક બૉટ ધરાવે
છે, જ્યાં વધુ ગોઠવણ
નથી. હવામાં એકદમ
હજુ પણ છે અને હું
બોલ છોડું છું. ભૌતિકશાસ્ત્રની
મદદ સાથે આપણે ઘણું
બધું કરી શકીએ છીએ
કે કેવી રીતે બોલ
માળને ફટકારવા માટે
લે છે. તે એક ડીટર્મીનીસ્ટિક
(deterministic) પ્રક્રિયા
છે. ત્યાં ત્યાં ખૂબ
અનિશ્ચિતતા નથી બીજી
બાજુ, જો મને પૂછવામાં
આવે કે આવતીકાલે
વરસાદ હોઈ શકે કે
6 માસમાં તે વરસાદમાં
જશે અથવા જો હું કોઈ
અન્ય વાતાવરણ પ્રક્રિયાની
લાક્ષણિકતાઓ અથવા
તો અર્થશાસ્ત્રિક
પ્રક્રિયાની પણ તપાસ
કરીશ અથવા તો સેન્સર(sensor)નો
અવાજ અને તેથી પર,
સેન્સર(sensor)માં ભૂલની
આગલી કિંમત શું છે
તે આગાહી કરવી ખૂબ
જ મુશ્કેલ છે, ઉદાહરણ
તરીકે.
આવી પરિસ્થિતિઓમાં,
અમે સંભાવના સિદ્ધાંતમાં
આશ્રય લઈએ છીએ અને
અમે કહીએ છીએ કે પ્રક્રિયાની
સંપૂર્ણ જાણકારી
નથી. તેથી, હું એમ

Kannada: 
ಸಂಕುಚಿತಗೊಳ್ಳುತ್ತವೆ,
ಮತ್ತು ನಿಮ್ಮ ಡೇಟಾ
ವಿಶ್ಲೇಷಣೆಯ ಪಠ್ಯವನ್ನು
ಗಣನೀಯವಾಗಿ ಬದಲಾಯಿಸಬಹುದು.
ಅವರು ಭೌತಿಕ ಪ್ರಕ್ರಿಯೆಯ
ಭಾಗವಾಗಿಲ್ಲದ ಅನಗತ್ಯ
ರೇಖಾತ್ಮಕವಲ್ಲದ ಅಂಶಗಳನ್ನು
ಪರಿಚಯಿಸಬಹುದು.
ಇದು ನಿಮ್ಮ ಡೇಟಾ ಸ್ವಾಧೀನ
ಪ್ರಕ್ರಿಯೆಯ ಒಂದು
ಭಾಗವಾಗಿದೆ.
ಮತ್ತು ನಾವು ದೃಶ್ಯೀಕರಣದ
ಬಗ್ಗೆ ಮಾತನಾಡುತ್ತಿದ್ದೆವು,
ಅಲ್ಲಿ ನಾವು ಉನ್ನತ
ಆಯಾಮದ ಪ್ಲಾಟ್ಗಳು,
ಬಾರ್ ಚಾರ್ಟ್ಗಳು ಮತ್ತು
ಇನ್ನಿತರ ಸರಳ ಪ್ರವೃತ್ತಿಯನ್ನು
ನೋಡಬಹುದು.
ಈ ಪಟ್ಟಿಯು ನಿಸ್ಸಂಶಯವಾಗಿ
ಸಮಗ್ರವಾಗಿಲ್ಲ, ಆದರೆ
ವಿಶ್ಲೇಷಣೆಗಿಂತ ಮೊದಲು,
ಸಮಯದಲ್ಲಿ ಮತ್ತು ನಂತರ
ಚಿತ್ರಾತ್ಮಕ ಪ್ರತಿನಿಧಿಗಳಿಗೆ
ಸಂಖ್ಯೆಗಳನ್ನು ಪರಿವರ್ತಿಸುತ್ತದೆ.
ಆದ್ದರಿಂದ ದೃಷ್ಟಿಗೋಚರವು
ವಿಶ್ಲೇಷಣೆಯ ಪ್ರತಿಯೊಂದು
ಹಂತದ ಭಾಗ - ಅವಿಭಾಜ್ಯ
ಭಾಗವಾಗಿದೆ.
ಆದ್ದರಿಂದ, ನಾವು ಮೂಲತಃ
ದೃಶ್ಯೀಕರಣದ ಅಗತ್ಯವನ್ನು
ಒತ್ತು ನೀಡುವ ಎನ್ಸ್ಕೊಂಬ್
ಡೇಟಾ ಸೆಟ್ಗಳ ಬಗ್ಗೆ
ಮಾತನಾಡಿದ್ದೇವೆ.
ವಿಶ್ಲೇಷಣೆಯ ಮುಖ್ಯ
ಹಂತಗಳು ನಾವು ಬಗ್ಗೆ
ಮಾತನಾಡುತ್ತೇವೆ ಮತ್ತು
ನಂತರ ಉಪನ್ಯಾಸವನ್ನು
ಕೊನೆಗೊಳಿಸುತ್ತೇವೆ.
ವಿಶ್ಲೇಷಣೆಯ ಡೊಮೇನ್
ಅನ್ನು ಆಯ್ಕೆಮಾಡಿ.
ನಾವು ಡೊಮೇನ್ ಮೂಲಕ
ಅರ್ಥವೇನೆಂದರೆ, ನಾವು
ಪಡೆದ ಡೇಟಾವನ್ನು ಅದೇ
ಡೊಮೇನ್ನಲ್ಲಿ ವಿಶ್ಲೇಷಿಸಲು
ಬಯಸುತ್ತೀರಾ.
ಸಾಮಾನ್ಯವಾಗಿ ಸಮಯವು
ಡೊಮೇನ್-ಸ್ವತಂತ್ರ
ಡೊಮೇನ್ - ಇದರಲ್ಲಿ
ನಾವು ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸುತ್ತೇವೆ,
ಆದರೆ ಸಮಯ ಡೊಮೇನ್ನಲ್ಲಿ
ನಾವು ಡೇಟಾವನ್ನು ವಿಶ್ಲೇಷಿಸಲು
ಬಯಸುವುದಿಲ್ಲ.
ಕೆಲವೊಮ್ಮೆ ನಾವು ಆವರ್ತನ
ಡೊಮೇನ್ಗೆ ಚಲಿಸಲು
ಬಯಸಬಹುದು.
ವಾಸ್ತವವಾಗಿ, ಇದು
ಆವರ್ತಕ ಪತ್ತೆಕಾರಕದಲ್ಲಿ
ಅನುಸರಿಸಲ್ಪಡುವ ಅತ್ಯಂತ
ಸಾಮಾನ್ಯ ವಿಧಾನವಾಗಿದೆ.
ವಾಯುಮಂಡಲದ ಡೇಟಾ ಅಥವಾ
ಕಂಪನ ಯಂತ್ರದಿಂದ ಬರುವ
ಡೇಟಾವನ್ನು ನೋಡಿದರೆ,
ಇಸಿಜಿ ಅಥವಾ ಇಇಜಿ
ದತ್ತಾಂಶವು ಅಂತಹ ಎಲ್ಲಾ
ಮಾಹಿತಿಗಾಗಿ, ಫ್ರಿಕ್ವೆನ್ಸಿ
ಡೊಮೇನ್ ಅನಾಲಿಸಿಸ್
ಎನ್ನುವುದು ಬಹಳ ಅನುಕೂಲಕರವಾದ
ವಿಶ್ಲೇಷಣೆಯ ಕ್ಷೇತ್ರವಾಗಿದೆ
ಏಕೆಂದರೆ ಇದು ನೇರವಾಗಿ
ಭೌತಿಕ ಗುಣಲಕ್ಷಣಗಳಿಗೆ
ಸಂಬಂಧಿಸಿರುವ ಲಕ್ಷಣಗಳನ್ನು
ತೋರಿಸುತ್ತದೆ.
ಪ್ರಕ್ರಿಯೆ.
ಮತ್ತು ಸಹಜವಾಗಿ, ನೀವು
ಜಂಟಿ ಸಮಯ ಆವರ್ತನ
ವಿಶ್ಲೇಷಣೆಯನ್ನು
ಮಾಡಬೇಕಾದ ಅನೇಕ ಬಾರಿ.
ವೇವ್ಲೆಟ್ಸ್ ಒಂದಾಗಿದೆ.
ಆದ್ದರಿಂದ, ವಿಶ್ಲೇಷಣೆಯ
ಡೊಮೇನ್ ಅನ್ನು ಆಯ್ಕೆ
ಮಾಡಿ ಮತ್ತು ಸಮಯವು
ಅಗತ್ಯವಿಲ್ಲ, ಇದು
ಸ್ಥಳಾವಕಾಶವೂ ಆಗಿರಬಹುದು.
ಆವರ್ತನ ಸ್ಪೆಕ್ಟ್ರೋಸ್ಕೋಪಿ
ಅಕ್ಷಾಂಶವು ಕ್ರೊಮ್ಯಾಟೊಗ್ರಾಫ್ನ
ಆವರ್ತನದ ಕ್ರಿಯೆಯಂತೆ
ಬರುವಂತೆ, ಅನೇಕ ಬಾರಿ
ಡೇಟಾವನ್ನು ನೇರವಾಗಿ
ಆವರ್ತನದ ಕಾರ್ಯದಂತೆ
ನಿಮಗೆ ಬರಬಹುದು.
ನಂತರ ನಾವು ನಿರ್ಧಾರ
ತೆಗೆದುಕೊಳ್ಳಬೇಕಾದ
ಎರಡನೆಯದು ಮಿತಿಮೀರಿದ
ಕಡಿತ ಮತ್ತು ವಿಶೇಷವಾಗಿ
ನಾವು ದೊಡ್ಡ ಆಯಾಮದ
ಡೇಟಾವನ್ನು ನೋಡುತ್ತಿರುವಾಗ.
ಇದು ಈಗ ಹೆಚ್ಚಾಗುತ್ತಿದೆ.
ಬೃಹತ್ ಆಯಾಮಗಳಲ್ಲಿ
ಬಹುಸಂಖ್ಯೆಯ ಡೇಟಾವನ್ನು
ವಿಶ್ಲೇಷಿಸಲು ಸಾಧ್ಯವಿಲ್ಲ,
ಅದರಲ್ಲೂ ವಿಶೇಷವಾಗಿ
ನೂರಾರು ಮತ್ತು ಸಾವಿರಾರು
ಮತ್ತು ಅದಕ್ಕೂ ಮುಂಚೆ
ಹೋಗುತ್ತದೆ ಮತ್ತು
ಅವು ಇಂದು ಬಹಳ ಸಾಮಾನ್ಯವಾಗಿದೆ.
ಮತ್ತು ಈ ವಿಷಯದಲ್ಲಿ
ಯಂತ್ರ ಕಲಿಕೆ ಕ್ರಮಾವಳಿಗಳು

Bengali: 
হওয়া উচিত শব্দটি
- জনসংখ্যা এবং নমুনা।
আমরা জানি স্টকাস্টিক
প্রক্রিয়ার মধ্যে,
যেমন আমরা আগেই উল্লিখিত,
আমরা যখন ডেটা রেকর্ড
পাই তখন আমরা দেখি,
আমাদের যে ডেটা রেকর্ড
আছেঅনেক, অনেক সম্ভাবনার
মধ্যে - একসময় গুনগতভাবে
সীমিত, কখনও কখনও
গণনা করা অসীম বা
অসীম - অনেক সম্ভাব্য
তথ্য রেকর্ড বিদ্যমান,
যার মধ্যে আমরা এক
পালন করেছেন; যে তত্ত্ব,
সমগ্র তত্ত্ব যে
ভিত্তি উপর নির্মিত
হয়।
জনসংখ্যার সমস্ত
সম্ভাবনাগুলি বোঝায়
যা আপনি দেখতে পারেন,
যদিও আমরা তা পালন
করি না; এটি বেশিরভাগ
পরিস্থিতিতেই সম্ভাব্য
সব সম্ভাবনাগুলি
পালন বা পালন করা
সম্ভব নয়।
সুতরাং, জনসংখ্যা
সমস্ত ঘটনা বা সম্ভাবনার
সংগ্রহ বোঝায়।
তাপমাত্রা পরিমাপ
যে আমরা আগে সম্পর্কে
ambience এর আগে কথা বলে
যখন সম্মান সঙ্গে
যদি আমি একটি সময়ের
মধ্যে একটি সেন্সর
সঙ্গে শত পর্যবেক্ষণ
সংগ্রহ, অন্য সেন্সর
একটি ভিন্ন পদ্ধতিতে
যে দেখতে হবে; যাতে
অন্য ডেটা রেকর্ড
অসম্ভব হতে পারে
বা একই সেন্সর নিজে
রেকর্ড করতে পারে,
সবকিছুই ধ্রুবকভাবে
সম্পূর্ণ ভিন্ন মান
রেকর্ড করতে পারে।
তাই, সম্ভবতঃ এই সকল
সম্ভাব্য মান বুঝতে
পারি না, তবে তাত্ত্বিকভাবে
এই সব সম্ভাব্য স্থান
কল্পনা করা গুরুত্বপূর্ণ
এবং আমরা এটিকে জনসংখ্যার
হিসাবে কল করি যা
আমরা একটি নমুনা
সংগ্রহ করি।
আমি এখানে নমুনা
বলতে যখন এটি একটি
পর্যবেক্ষণ নয়,
পরিসংখ্যান একটি
নমুনা সাধারণত পর্যবেক্ষণ
পর্যবেক্ষণ বোঝায়।
এটি মূলত একটি ডেটা
রেকর্ডকে বোঝায়,
কিন্তু সিগন্যাল
প্রক্রিয়াকরণে,
একটি নমুনা তাত্ক্ষণিক
এক মূল্য হতে পারে
এবং এটি নির্ণায়কভিত্তিক
জগতে রয়েছে।
এই জনসংখ্যার এবং
নমুনা অনুরূপ আমরা
একটি সত্য এবং একটি
অনুমান আছে।
আমরা শুধু জনসংখ্যা
সব সম্ভাবনার একটি
সংগ্রহ বলেছেন, কিন্তু
যে সত্য দ্বারা চিহ্নিত
করা।
সুতরাং, এই সমগ্র
জনসংখ্যার, উদাহরণস্বরূপ,
নির্দিষ্ট মানে।
আসুন আমরা বলি, আমি
একটি বয়সের একটি
গ্রুপের গড় বেতন
খুঁজছি - একটি খুব
বড় দেশে, আসুন আমরা
বলি বা খুব বড় দৃঢ়।
এটা আমার পক্ষে সম্ভব
নয় এবং প্রত্যেকের
কাছে জিজ্ঞাসা করা
উচিত নয়।
ব্যবহারিক কারণগুলির
জন্য, আমি কেবল কয়েকজন
লোককে তার বেতন সম্পর্কে
এই তথ্য সংগ্রহ করতে
জিজ্ঞাসা করতে পারি
এবং যার থেকে আমি
সত্য গড় বেতন দেখি।
সুতরাং, প্রকৃত গড়
বেতন হল একটি সত্য,
যেটি জনসংখ্যার পরিমাপ
করে - যে বয়সের গ্রুপ
- এবং অনুমান যা আমি
তথ্য থেকে প্রাপ্ত।
স্পষ্টতই, অনুমান
সত্য থেকে সবসময়
আলাদা হবে কারণ আমি
সব সম্ভাবনা দেখেনি।
এবং মূল্যায়ন তত্ত্ব
আপনাকে সুস্পষ্টভাবে,

Gujarati: 
ધારીશ કે ત્યાં ઘણી
શક્યતાઓ છે, અને હું
તે શક્યતાઓની દરેકને
તક આપવાનો છું, અને
તે જ્યાં સંભાવના
સિદ્ધાંત જન્મ લે
છે, અને તે જ છે કે
જ્યાં સમય શ્રેણીનું
એનાલિસિસ(analysis) આવે
છે ત્યાં બીજી એક
એવી સ્થિતિ છે કે
જેમાં તમે ધારવું
પડશે પ્રક્રિયા સ્ટોકેસ્ટિક(stochastic)
હોવી જોઈએ અને તે
પરિસ્થિતિ એ છે કે
જ્યાં તમે જોઈ રહ્યા
છો તે માહિતીનું
કારણ અજ્ઞાત છે. તેથી,
એક સરળ ઉદાહરણ તરીકે
ધારો કે હું સ્ટોક
માર્કેટ ઇન્ડેક્સના
પૂર્વાનુમાનને જોઈ
રહ્યો છું. ઘણા કારણો
છે જે ખરેખર અસર કરે
છે; સ્ટોક માર્કેટ
ઇન્ડેક્સ માટે જવાબદાર
એવા ઘણા કારણો છે.
હવે, કમનસીબે, જો હું
કારણોને જાણું છું,
તો પણ હું તેને માપવા
માટે સક્ષમ ન હોઈ
શકું છું અને કેટલીકવાર
મને પરિબળોને પૂર્ણપણે
પૂરતી ખબર નથી. તો,
હું શું કરું?
હું ઇતિહાસ પર આધાર
રાખું છું, અને આશા
રાખું છું કે ઇતિહાસમાં
તેની કેટલીક પ્રતિષ્ઠા
છે, અને હું ઐતિહાસિક
પધ્ધતિઓ અને સહસંબંધોનો
ઉપયોગ કરું છું અને
આ રીતે આગળ વધું છું,
અને આગાહી કરું છું,
પરંતુ તે અનુમાન
ચોક્કસ બનશે, ચોક્કસ
નહીં. આ મુદ્દો એ છે
કે આપણે ઇતિહાસને
જોઈને અલગ છીએ, આપણે
જે મુખ્ય ધારણા કરીએ
છીએ તે એ છે કે આ શેરબજારની
પ્રક્રિયા - જે કંઈક
બનાવટી પ્રક્રિયા
છે જે ઇન્ડેક્સ પેદા
કરે છે - તે કુદરતમાં
રેન્ડમ છે. તે બહાર
ફેંકી દે છે, તે શેરબજારના
ઇન્ડેક્સના મૂલ્યને
બહાર ફેંકી શકે છે
જેમાંથી હું એક નિરીક્ષણ
કરું છું. ત્યાં ઘણી
અન્ય શક્યતાઓ હોઇ
શકે છે જેમાંથી એક
બન્યું છે. વાસ્તવમાં
તે કેસ ન હોઈ શકે.
સાચી પ્રક્રિયા તે
રીતે વર્તન કરી શકતી
નથી; તે એક એવી ધારણા
છે જે હું કરી રહ્યો
છું, જેથી ડેટા એનાલિસિસ(
data analysis)માં આગળ વધવું;
તે ખૂબ, ખૂબ જ મહત્વપૂર્ણ
છે. બીજા શબ્દોમાં
કહીએ તો, જ્યારે હું
પ્રક્રિયાને સ્ટોકેસ્ટિક(stochastic)
માનુ છું, ત્યારે
એ કહેવાનો ઔપચારિક
રસ્તો છે કે મને પ્રક્રિયાની
પૂરતી સમજણ નથી. પરંતુ
ત્યાં એવી પરિસ્થિતિઓ
છે જ્યાં મારી પાસે
મિશ્ર કેસ છે - જ્યાં
મારી પાસે પ્રક્રિયાના
એક ભાગનું એકદમ સારું
જ્ઞાન છે અને પ્રક્રિયાના
બીજા ભાગો મારાથી
આગળ છે તે જ છે જ્યાં
આપણી પાસે ડીટર્મીનીસ્ટિક
(deterministic) અને સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયા છે. અને
તે એન્જિનિયરિંગ
એરેનામાં ખૂબ જ સામાન્ય
છે કારણ કે ભૌતિક
પ્રક્રિયા સારી રીતે
સમજી શકાય છે, જેમ
કે રિએક્ટરના ઉદાહરણમાં
કે જે આપણે અગાઉ ચર્ચા
કરી હતી, પરંતુ સેન્સર(sensor)
અથવા અસ્પષ્ટ વિક્ષેપની
કેટલીક અસરો, જે મારા
નિયંત્રણથી બહાર
છે, તે સ્ટોકેસ્ટિક(stochastic)
તરીકે ગણવામાં આવે
છે કારણ કે હું તેમને
ચોક્કસપણે આગાહી
કરી શકતો નથી તેથી,
ત્યાં અમે બંને ડીટર્મીનીસ્ટિક
(deterministic) અને સ્ટોકેસ્ટિક(stochastic)
ટિપ્પણીઓ સાથે વ્યવહાર
કરી શકે છે, અને એક
સિદ્ધાંત છે જે તમને
તે કરવા દે છે. તેથી,
નીચે લીટી કૃપા કરીને
થોડો સમય પૂછવા માટે
ખર્ચ કરે છે - સૌ પ્રથમ
તો તમે ડીટર્મીનીસ્ટિક
(deterministic) તરીકે માહિતીનો
ઉપયોગ કરવા માગો
છો, એક નિર્ધારક અથવા

Bengali: 
সুসংগত পদ্ধতিতে,
রেকর্ডকৃত ডেটা থেকে,
কীভাবে আগ্রহের প্যারামিটারটির
অনুমান করতে পারে
তা বলে।
এই সঙ্গে সংযুক্ত,
আমরা এই অনুমান আছে।
আপনি এই পদ সংখ্যার
এবং আংশিক বলা হয়।
একটি পরিসংখ্যান
কিন্তু আপনার পর্যবেক্ষণ
একটি গাণিতিক ফাংশন
কিছুই।
আবার, নমুনা মানে
একটি পরিসংখ্যান;
নমুনা পার্থক্য একটি
পরিসংখ্যান।
এটি শুধু একটি গাণিতিক
অপারেশন যা আপনি
পর্যবেক্ষণে কাজ
করছেন।
একটি অনুমানকারী
একটি গাণিতিক ফাংশন।
আপনি বলতে পারেন
এটি একটি নরম ডিভাইস
বা ভার্চুয়াল ডিভাইস
যা একটি গাণিতিক
ভাবে ডেটার উপর কাজ
করে এবং আপনি যা চান
তার একটি অনুমান
পাবেন।
পরিসংখ্যান এবং অনুমানের
মধ্যে পার্থক্য মোটামুটি
suttle হয়।
প্রথম দৃষ্টিভঙ্গি
তারা একই বলে মনে
হয়, কিন্তু পার্থক্য
হয়, পরিসংখ্যান
নিছক একটি উদ্দেশ্যে
গাণিতিকভাবে একটি
গাণিতিক ফাংশন হয়
না; যদিও, একটি অনুমানকারী
একটি গাণিতিক অপারেশন
যা কিছু নির্দিষ্ট
কিছু অনুমানের সঠিক
উদ্দেশ্য নিয়ে পরিচালিত
হয়।
সুতরাং, যদি আপনি
অনুমান তত্ত্বের
মধ্যে আরো নিচে যান,
আপনি পরিসংখ্যান
এবং অনুমানকারী মধ্যে
এই পার্থক্য উপর
আরো আলোচনা দেখতে
পাবেন, কিন্তু যতদূর
গাণিতিক অপারেশন,
উভয় তথ্য গাণিতিক
ফাংশন হয়।
সুতরাং, অনুমান তত্ত্বের
মধ্যে, আমরা প্রায়ই
পরিসংখ্যান এবং estimators
ব্যবহার করি।
সুতরাং, নমুনা অর্থ
উভয়ই একটি পরিসংখ্যান
এবং সত্য অর্থের
যথাযথ মূল্যায়নকারী
উভয়ই, কারণ নমুনা
অর্থ সত্য অর্থ অনুমান
করার জন্য তৈরি করা
হয়েছে, এবং আবার
সংযুক্ত; হিসাবে
আপনি এটি জনসংখ্যা
এবং নমুনা সম্পর্কে
সব দেখতে পারেন; আপনি
ensemble এবং নমুনা গড়
আছে।
এনসেমল গড় গড় আপনি
যে সব সম্ভাব্য মানগুলি
থেকে আপনি কখনো গণনা
করতেন যা আপনি কখনো
দেখেছেন, অবশ্যই,
আমরা কখনো দেখতে
পাই না; বেশিরভাগ
পরিস্থিতিতে আমরা
কখনও কখনও সম্ভাব্য
সমস্ত তথ্য রেকর্ড
বা বেতন উদাহরণ সংগ্রহ
করতে পারি না, তবে
সব সম্ভাব্য লোকেদের
অর্থবহ সময়ের মধ্যে
তথ্য সংগ্রহ করা
সম্ভব নাও হতে পারে,
নমুনা গড় অবশ্যই
অবশ্যই গড় গণনা
করা হয় এই নমুনার
থেকে এবং এই গড় ব্যবহার
করা হয় যা সংজ্ঞায়িত
করা হয় যা এগারোডিক্ট
প্রক্রিয়া হিসাবে
পরিচিত।
আমরা যে মধ্যে যেতে
হবে না অবশেষে, ডাটা
শর্তাদিতে দুটি শর্তের
পক্ষপাত এবং পরিবর্তনশীলতা
খুবই গুরুত্বপূর্ণ
কারণ তারা উভয় ত্রুটি
সম্পর্কে কথা বলছে
যে কেউ কিছু পরামিতি
বা প্যারামিটারের
একটি সেট অনুমান
করে।
বায়াস একটি পদ্ধতিগত
ত্রুটি যে একটি আপ
শেষ পর্যন্ত; প্রতিটি
মূল্যায়ন ব্যায়াম

Kannada: 
ಬಹಳ ಸುಲಭವಾಗಿವೆ.
ಪ್ರಧಾನ ಘಟಕ ವಿಶ್ಲೇಷಣೆ,
ಋಣಾತ್ಮಕ ಮಾತೃಕೆ ಫ್ಯಾಕ್ಟರೈಸೇಶನ್,
ಮತ್ತು ಇತರ ಆಯಾಮದ
ಕಡಿತ ತಂತ್ರಗಳು ದೊಡ್ಡ
ಆಯಾಮದ ಡೇಟಾ, ದೊಡ್ಡ
ಆಯಾಮದ ಡೇಟಾವನ್ನು
ವಿಶ್ಲೇಷಿಸುವಲ್ಲಿ
ಅತ್ಯಂತ ಶಕ್ತಿಯುತವಾಗಿದೆ.
ಹಾಗಾಗಿ, ನಾನು ಪಡೆದಿರುವ
ಆಯಾಮಗಳಲ್ಲಿ ಅಥವಾ
ಕಡಿಮೆ ಕ್ರಮದಲ್ಲಿ
ಅಥವಾ ಕಡಿಮೆ ಕ್ರಮದ
ಆಯಾಮದಲ್ಲಿ ವಿಶ್ಲೇಷಿಸಲು
ನಾವು ನಿರ್ಧಾರ ತೆಗೆದುಕೊಳ್ಳಬೇಕು.
ಮತ್ತು ಅತ್ಯಂತ ಮುಖ್ಯವಾಗಿ
ಸರಿಯಾದ ಗಣಿತ ಅಥವಾ
ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ
ಪರಿಕರವನ್ನು ಆರಿಸುವುದು.
ಉದಾಹರಣೆಗೆ, ನಾನು
ಸರಾಸರಿ ಅಂದಾಜು ಮಾಡಲು
ಬಯಸಿದರೆ, ನಾನು ಸರಾಸರಿ,
ಮಾದರಿ ಸರಾಸರಿ ಅಥವಾ
ಮಾದರಿ ಮಧ್ಯಮವನ್ನು
ಅಂದಾಜುದಾರನಾಗಿ ಆಯ್ಕೆ
ಮಾಡಬಹುದು.
ಈಗ, ನಾನು ಮಾದರಿ ಮಾಪನವನ್ನು
ಅಂದಾಜಕನಾಗಿ ಆರಿಸಬೇಕು,
ಯಾವಾಗ ನಾನು ಮಾದರಿಯ
ಮಧ್ಯಮವನ್ನು ಆರಿಸಬೇಕು
- ಇದಕ್ಕೆ ಸರಿಯಾದ ಉತ್ತರ
ಇಲ್ಲ, ಆದರೆ ಕೆಲವು
ಉತ್ತಮ ಮಾರ್ಗಸೂಚಿಗಳಿವೆ.
ದತ್ತಾಂಶವು ಹೊರಗಿನವರಿಂದ
ಮುಕ್ತವಾಗಿದೆ ಮತ್ತು
ಗೊಸ್ಸಿಯನ್ ವಿತರಣೆ
ಪ್ರಕ್ರಿಯೆಯಿಂದ ಹೊರಬರುತ್ತಿದೆ
ಎಂದು ನನಗೆ ತಿಳಿದಿದ್ದರೆ,
ಮಾದರಿ ಅರ್ಥವು ನಿಮಗೆ
ಅತ್ಯಂತ ಸಮರ್ಥ ಅಂದಾಜುದಾರನನ್ನು
ನೀಡುತ್ತದೆ - ಅಂದಾಜುಗಾರರಲ್ಲಿ
ಅತೀ ಕಡಿಮೆ ದೋಷಕ್ಕೆ
ಅಂದಾಜು ಅರ್ಥ; ಆದರೆ
ದತ್ತಾಂಶವನ್ನು ಹೊರಗಿನವರು
ಸರಿಪಡಿಸಬಹುದು ಎಂದು
ನಾನು ಗಮನಿಸಿದರೆ,
ಮತ್ತು ನನ್ನ ಅಂದಾಜುಗಾರನು
ಅದಕ್ಕೆ ಪರಿಣಾಮ ಬೀರಲು
ಬಯಸುವುದಿಲ್ಲ, ನಂತರ
ಮಾದರಿ ಸರಾಸರಿ ದೃಢವಾಗಿಲ್ಲ.
ಅಂದರೆ ಇದು ಬಹಳ ಸೂಕ್ಷ್ಮವಾದ
ಹೊರಗಿನವರೇ, ನಂತರ
ನಾನು ಮಾದರಿ ಮಧ್ಯಮವನ್ನು
ಬಳಸಬೇಕು.
ಇದು ನನಗೆ ತಿಳಿದಿರುವ
ಮತ್ತು ನನ್ನ ಪ್ರಾಥಮಿಕ
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯ
ಹಂತದಿಂದ ನಾನು ಪಡೆದ
ಜ್ಞಾನದ ಹಿಂದಿನ ಜ್ಞಾನವನ್ನು
ಅವಲಂಬಿಸಿದೆ.
ಮತ್ತು ಈ ರೀತಿಯ ನಿರ್ಧಾರಗಳನ್ನು
ಪ್ರತಿ ಹಂತದಲ್ಲಿ ಮಾಡಬೇಕಾಗಿದೆ
ಮತ್ತು ಅಲ್ಲಿ ಅನನ್ಯವಾದ
ಉತ್ತರ ಇಲ್ಲದಿರಬಹುದು.
ನೆನಪಿಡಿ; ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ,
ನಿಮ್ಮ ವಿಶ್ಲೇಷಣೆಯ
ಪ್ರತಿ ಹಂತಕ್ಕೂ ಅಗತ್ಯವಾದ
ಯಾವುದೇ ಉತ್ತರವಿಲ್ಲ
ಮತ್ತು ಅಂತ್ಯದವರೆಗೆ,
ನೀವು ಒಂದು ಮಾದರಿಯನ್ನು
ನಿರ್ಮಿಸುವಾಗಲೂ, ನಿರ್ದಿಷ್ಟ
ಡೇಟಾವನ್ನು ವಿವರಿಸಬಹುದಾದ
ಅನೇಕ ಮಾದರಿಗಳು ಇರಬಹುದು
ಮತ್ತು ನೀವು ನಿಜವಾಗಿ
ಮಾದರಿಯನ್ನು ಆಧರಿಸಿರಬಹುದು
ಕೆಲವು ಮಾನದಂಡಗಳ ಮೇಲೆ.
ಅದೇ ರೀತಿ, ಊಹಾ ಪರೀಕ್ಷೆಯಲ್ಲಿ,
ನಾವು ಸರಿಯಾದ ಅಂಕಿಅಂಶ
ಮತ್ತು ವ್ಯತ್ಯಾಸದ
ವಿಶ್ಲೇಷಣೆಯನ್ನು
ಆರಿಸಬೇಕಾಗುತ್ತದೆ.
ವ್ಯತ್ಯಾಸದ ಮೂಲಗಳು
ಏನೆಂದು ನಾವು ಮೊದಲಿಗೆ
ತಿಳಿದುಕೊಳ್ಳಬೇಕಾಗಬಹುದು;
ಕನಿಷ್ಟ ಪಕ್ಷದಲ್ಲಿ
ಸಾಕಷ್ಟು ಚೆನ್ನಾಗಿ
ಊಹಿಸಿ ಅಥವಾ ಮಾಡೆಲಿಂಗ್ನಲ್ಲಿ
ನೀವು ಸರಿಯಾದ ರಿಗ್ರೆಸರ್
ಸೆಟ್ ಮತ್ತು ಮಾಡೆಲ್
ರಚನೆ ಮತ್ತು ಇನ್ನೊಂದನ್ನು
ಆಯ್ಕೆ ಮಾಡಬೇಕಾಗಿರುತ್ತದೆ
ಮತ್ತು ಮುಂಚಿತವಾಗಿ
ಮತ್ತು / ಅಥವಾ ಡೊಮೇನ್
ಜ್ಞಾನದಲ್ಲಿ ಯಾವಾಗಲೂ
ಕಾರಣವಾಗಬಹುದು.
ಭೌತಶಾಸ್ತ್ರ ಅಥವಾ
ಪ್ರಕ್ರಿಯೆಗೆ ಅಗತ್ಯವಾಗಿಲ್ಲ,
ಆದರೆ ಸಂವೇದಕ ಗುಣಲಕ್ಷಣಗಳಿಂದಲೂ
ಮತ್ತು ಅದಕ್ಕಿಂತಲೂ
ಹೆಚ್ಚಾಗಿ, ನೀವು ಡೊಮೇನ್
ಅಥವಾ ಭೌತಶಾಸ್ತ್ರ
ಅಥವಾ ರಸಾಯನಶಾಸ್ತ್ರ
ಅಥವಾ ಜೀವಶಾಸ್ತ್ರದ
ಬಗ್ಗೆ ಏನಾದರೂ ತಿಳಿದಿರಬಹುದು
ನೀವು ಸುಲಭವಾಗಿ ಕಾರಣವಾಗಬಹುದು
ಮತ್ತು ಬಹಳಷ್ಟು ತಲೆನೋವುಗಳನ್ನು
ಉಳಿಸಬಹುದು.
ಮತ್ತು ಅಂತಿಮವಾಗಿ,
ನಿಮ್ಮ ಎಲ್ಲ ವಿಶ್ಲೇಷಣೆಯೊಂದಿಗೆ
ನೀವು ಒಮ್ಮೆ ಮಾಡಿದರೆ,
ಇದು ಅತ್ಯಂತ ಮುಖ್ಯವಾದ
ಭಾಗವಾಗಿದೆ - ನೀವು
ಪಡೆದ ಫಲಿತಾಂಶಗಳನ್ನು
ನಿರ್ಣಯಿಸುವುದು ಮತ್ತು
ಅವುಗಳನ್ನು ವರದಿ ಮಾಡುವುದು

Kannada: 
ಬಹಳ ಮುಖ್ಯವಾದ ಹಂತ.
ಯಾವಾಗಲೂ ಯಾವುದೇ ಪ್ಯಾರಾಮೀಟರ್ಗೆ
ಒಳಪಟ್ಟಿರುತ್ತದೆ,
ಊಹೆಯ ಪರೀಕ್ಷೆಗೆ ಅಂದಾಜು
- ಇದು ಸಾಕಷ್ಟು ಮಹತ್ವದ್ದಾಗಿರಲಿ,
ನೀವು ಶೂನ್ಯೇತರ ಮೌಲ್ಯವನ್ನು
ಆಕಸ್ಮಿಕವಾಗಿ ಪಡೆಯುತ್ತೀರಾ,
ನಿಜವಾಗಿಯೂ ನೀವು ಶೂನ್ಯವನ್ನು
ಪಡೆದಿರಲಿ.
ಆದ್ದರಿಂದ, ಶೂನ್ಯ
ಎಂಬ ಪ್ಯಾರಾಮೀಟರ್ನ
ಊಹಾ ಪರೀಕ್ಷೆಯನ್ನು
ನೀವು ಒಳಪಡಿಸಬೇಕು
- ಅದು ಶೂನ್ಯ ಸಿದ್ಧಾಂತವಾಗಿದೆ,
ಮತ್ತು ನಂತರ, ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯವಾಗಿ
ಉತ್ತಮ ರೀತಿಯಲ್ಲಿ
ಮುಂದುವರಿಯಿರಿ.
ಎರಡನೆಯದಾಗಿ, ಅಂದಾಜುಗಳಲ್ಲಿ
ವಿಶ್ವಾಸಾರ್ಹ ಪ್ರದೇಶಗಳು
ಮತ್ತು ದೋಷಗಳನ್ನು
ವರದಿ ಮಾಡಿ. ವಾಸ್ತವವಾಗಿ,
ಕಂಪ್ಯೂಟಿಂಗ್ ವಿಶ್ವಾಸಾರ್ಹ
ಪ್ರದೇಶಗಳು ಮತ್ತು
ದೋಷಗಳು ನಿಮ್ಮ ಊಹೆಯ
ಪರೀಕ್ಷೆಯ ಅವಿಭಾಜ್ಯ
ಭಾಗವಾಗಿದೆ.
ತದನಂತರ, ನೀವು ಮಾದರಿಗಳನ್ನು
ನಿರ್ಮಿಸುತ್ತಿದ್ದರೆ,
ನಂತರ ಮೌಲ್ಯಮಾಪನ ಮಾದರಿಗಳನ್ನು
ದಾಟಲು.
ನಾನು ಇಲ್ಲಿ ಮಾದರಿಗಳನ್ನು
ಹೇಳಿದಾಗ, ಹಿಂಜರಿತ
ಮಾದರಿಗಳಾಗಿರಬಾರದು,
ಇದು ಸಹ ವರ್ಗೀಕರಣಕಾರಕವಾಗಿರಬಹುದು.
ಮತ್ತು ಅನೇಕ ಮಾದರಿಗಳನ್ನು
ಗುರುತಿಸಿದರೆ, ಮಾನದಂಡದ
ಮಿಶ್ರಣವನ್ನು ಬಳಸಿ;
ನಾನು ಮೊದಲೇ ಹೇಳಿದಂತೆ,
ಅನನ್ಯ ಉತ್ತರ ಇಲ್ಲದಿರಬಹುದು;
ವಿಶಿಷ್ಟವಾಗಿ, ಅದು
ನಿಜ. ನನ್ನ ವಿದ್ಯಾರ್ಥಿಗಳು
ಯಾವಾಗಲೂ ನನ್ನನ್ನು
ಕೇಳುತ್ತಾರೆ, ಹಾಗೂ
ನಾನು ಡೇಟಾವನ್ನು ವಿವರಿಸುವ
ಎರಡು ಅಥವಾ ಮೂರು ಮಾದರಿಗಳನ್ನು
ಹೊಂದಿದ್ದೇನೆ, ಅದನ್ನು
ನಾನು ಆರಿಸಬೇಕೇ?
ಒಳ್ಳೆಯದು, ನೀವು ಹೊಂದಿದ
ಪರಿಹಾರಗಳ ಸಂಖ್ಯೆಯನ್ನು
ಕಡಿಮೆಗೊಳಿಸಲು ಮತ್ತು
ನೀವು ಅನೇಕ ಪರಿಹಾರಗಳನ್ನು
ಕೊನೆಗೊಳ್ಳುವ ಅತ್ಯುತ್ತಮ
ಪ್ರಯತ್ನಗಳ ನಡುವೆಯೂ
ಸಹ ಸಾಮಾನ್ಯವಾದ ವಿಧಾನವನ್ನು
ಅನುಸರಿಸಿದ್ದೀರಿ
ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.
ನಂತರ ನೀವು ಆಕೈ ಮಾಹಿತಿ
ಮಾನದಂಡ ಅಥವಾ ಬೇಯಿಸ್ಇನ್ಫಾರ್ಮೇಷನ್
ಮಾನದಂಡಗಳಂತಹ ಮಾಹಿತಿ
ಸೈದ್ಧಾಂತಿಕ ಕ್ರಮಗಳೆಂದು
ಕರೆಯಲ್ಪಡುತ್ತವೆ.
ಮತ್ತು ಮಾದರಿಯ ಕೊನೆಯ
ಬಳಕೆಯನ್ನು ಇರಿಸಿಕೊಳ್ಳಿ;
ನಿಮ್ಮ ಮಾದರಿ ಆನ್ಲೈನ್ನಲ್ಲಿ
ಕಾರ್ಯಗತಗೊಳ್ಳಬೇಕಿದೆ;
ಹಾಗಾಗಿ, ಭವಿಷ್ಯದ
ನಿಖರತೆ ಮತ್ತು ಅದರಿಂದಾಗಿ
ತ್ಯಾಗದ ಸ್ವಲ್ಪಮಟ್ಟಿಗೆ
ಸರಳ ಮಾದರಿಯನ್ನು ಸಂಕೀರ್ಣವಾದ
ಒಂದು ಆದ್ಯತೆ ನೀಡಲಾಗುತ್ತದೆ.
ಆದ್ದರಿಂದ, ಮತ್ತೆ
ಯಾವುದೇ ವಿಶಿಷ್ಟ ಉತ್ತರ
ಇಲ್ಲ, ಆದರೆ ಕೊನೆಯಲ್ಲಿ,
ನೀವು ವರದಿ ಮಾಡಿದ
ಅಂತಿಮ ಫಲಿತಾಂಶಗಳು
ಎರಡು ವಿಷಯಗಳನ್ನು
ಹೊಂದಿರಬೇಕು: ಇದಕ್ಕೆ
ಸಂಖ್ಯಾಶಾಸ್ತ್ರೀಯ
ಬೆಂಬಲ ಮತ್ತು ನೀವು
ಈ ಫಲಿತಾಂಶಗಳನ್ನು
ವರದಿ ಮಾಡಲು ನಿರ್ಧರಿಸಿದ್ದಕ್ಕಾಗಿ
ಮತ್ತು ಏಕೆ ಫಲಿತಾಂಶಗಳು
ಹಾದಿಯಲ್ಲಿವೆ ಎಂಬುದಕ್ಕೆ
ಒಂದು ಉತ್ತಮ ವಾದ ಅವರು.
ಆದ್ದರಿಂದ, ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ
ಕೇವಲ ವಿಜ್ಞಾನವಲ್ಲ
ಎಂದು ನೀವು ನೆನಪಿನಲ್ಲಿಟ್ಟುಕೊಳ್ಳಬೇಕು.
ಹೌದು, ಅದರ ದೊಡ್ಡ ಭಾಗವು
ವಿಜ್ಞಾನವಾಗಿದೆ, ಆದರೆ
ಅದರ ಪ್ರಮುಖ ಭಾಗವೂ
ಸಹ ಒಂದು ಕಲೆಯಾಗಿದೆ.
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆ ಆದ್ದರಿಂದ
ವಿಜ್ಞಾನ ಮತ್ತು ಕಲೆ
ಎರಡೂ. ವಿಶ್ವಾಸಾರ್ಹ
ಪ್ರದೇಶಗಳು ಮತ್ತು
ದೋಷಗಳನ್ನು ವರದಿ ಮಾಡದೆ
ಅಂದಾಜುಗಳನ್ನು ವರದಿ
ಮಾಡುವುದಿಲ್ಲ; ಸಾಧ್ಯವಾದಷ್ಟು,
ನೀವು ಖಂಡಿತವಾಗಿಯೂ
ಅದನ್ನು ಮಾಡಬೇಕು.
ಸಹಜವಾಗಿ, ತುಂಬಾ ಸಂಕೀರ್ಣವಾದ
ಪ್ಯಾರಾಮೀಟರ್ ಅಂದಾಜು
ಸಮಸ್ಯೆಗಳಲ್ಲಿ, ವಿಶ್ವಾಸಾರ್ಹ
ಪ್ರದೇಶಗಳನ್ನು ಪಡೆದುಕೊಳ್ಳುವುದು
ಬಹಳ ಕಷ್ಟಕರವಾಗಿರುತ್ತದೆ,
ಆದರೆ ನಿಮ್ಮ ಉತ್ತಮವಾದ
ಹೊರತಾಗಿಯೂ ನೀವು ಪ್ರಯತ್ನಿಸಬೇಕು
... ದೋಷಗಳನ್ನು ಮತ್ತು
ವಿಶ್ವಾಸಾರ್ಹ ಮಧ್ಯಂತರಗಳನ್ನು
ವರದಿ ಮಾಡಲು ನಿಮ್ಮ
ಪ್ರಯತ್ನಗಳಲ್ಲಿ ಅತ್ಯುತ್ತಮವಾದ
ಪ್ರಯತ್ನಗಳನ್ನು ಮಾಡಲು

Bengali: 
আপনাকে একটি অনুমান
দেবে যা ত্রুটিযুক্ত;
এ সম্পর্কে কোন সন্দেহ
নেই. প্রশ্ন হচ্ছে,
অনুমান এবং সত্যের
মধ্যে পার্থক্যটি
সম্ভবত হয় বা আপনার
অনুমানের কিছু ত্রুটি
বা সংকটের কারণে।
আপনার মূল্যায়ন
ব্যায়াম বা আপনার
অনুমানের মধ্যে পক্ষপাত
আছে কিনা তা আপনি
কিভাবে জানেন?
এই চিন্তার প্রক্রিয়া
কল্পনা করুন; আমি
সংগৃহীত করেছি শত
ডেটা রেকর্ড বা একাধিক
ডাটা রেকর্ড বা একাধিক
ডেটা রেকর্ড এক প্রসেসের
জন্য এবং আমি প্রতিটি
ডেটা রেকর্ডগুলির
জন্য নমুনা মানে
নির্ণয় করেছি।
যদি আমি গড়, আমাদের
বলতে হবে, এমনকি হাজার
হাজার, ডেটা রেকর্ডের
প্রায় এক মিলিয়ন
তথ্য রেকর্ড, আমার
কাছে এক নমুনা মানে;
এবং মিলিয়ন তথ্য
রেকর্ডের জন্য, তাই
আমি মিলিয়ন নমুনা
মানে আছে।
যদি আমি গড় নমুনা
মানে, মিলিয়ন নমুনা
মানে যে আমি আছে, আমি
খুব খুব খুব সত্য
হতে হবে, সত্যের কাছাকাছি।
যদি শুধুমাত্র মিলিয়ন
সম্ভাবনা আছে, আমি
সত্য পেতে হবে, কিন্তু
যদি এই পার্থক্য
যে এখনও এই মিলিয়ন
নমুনা গড় বা নমুনা
গড় এবং সত্যের মধ্যে
বিদ্যমান, তারপর
একটি পদ্ধতিগত ত্রুটি
আছে।
এই গড় গড় হিসাবে
আমরা উপরে কথা বলেছি,
যেমনটি আমি উপরে
লেখা করেছি, এটি প্রত্যাশা
হিসাবেও পরিচিত।
তাই অন্য কথায়, পক্ষপাতের
দিকে ফিরে আসার, যদি
অনুমানের প্রত্যাশিত
মান সত্য থেকে আলাদা,
তাহলে আমরা বলতে
পারি যে অনুমানের
মধ্যে একটি পক্ষপাত
আছে।
এখন, পরিবর্তনশীলতা
আসছে, এটি বিভিন্ন
ডেটা রেকর্ড জুড়ে
অনুমানের বিস্তারের
একটি পরিমাপ।
এটা খুব, খুবই গুরুত্বপূর্ণ
কারণ অনুশীলনের মধ্যে
আমি শুধুমাত্র একটি
তথ্য রেকর্ডের সাথে
কাজ করি এবং আমি একটি
একক ডেটা রেকর্ড
থেকে আমার সমস্ত
তথ্যগুলি তৈরি করি।
আমি জানি, আমার প্রশ্নের
উত্তর জানা প্রয়োজন
- আমি অন্য একটি তথ্য
রেকর্ড সংগৃহীত,
এবং আমার তথ্য রেকর্ড
থেকে তথ্য আঁকা ছিল,
যারা পরিদর্শক আমি
এখন দেখা যায় তা
থেকে উল্লেখযোগ্যভাবে
ভিন্ন হবে।
তারা ভিন্ন হবে, সম্ভবত,
সংখ্যাসূচকভাবে,
কিন্তু পার্থক্য
খুব বড় হবে?
এবং যদি তা খুব বড়
হয়, তাহলে আমরা বলি
যে মূল্যায়নের বা
অনুমানের একটি বড়
পরিবর্তনশীলতা আছে।
এই কারণে, পরিবর্তনগুলি
স্পষ্টতা হিসাবেও
উল্লেখ করা হয়।
অনুমানের পরিবর্তনটি
নিম্নমানের, আরো
নিখুঁত হয় অনুমানকারী।
বিপরীতে, পক্ষপাত
সঠিকতা পক্ষপাত নীচের,
অযৌক্তিকতা কম।
আসলে, শূন্য পক্ষপাতের
অর্থ হবে, এটি একটি
সঠিক; অনুমানকারী
একটি সঠিক এক আপনি
সত্য একটি সঠিক অনুমান
দেয়।
সাধারণত, আমরা পরিবর্তনশীলতা
সম্পর্কে আরো চিন্তিত।

Gujarati: 
સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયા અથવા મિશ્ર
પ્રક્રિયાની બહાર
આવતા છો અને તમારે
આનો જવાબ શા માટે
છે તમે તે ધારણા કરી
છે, કારણ કે એનાલિસિસ(analysis)
દરમિયાન તે ખરેખર
તેના પર આધાર રાખે
છે.
ઠીક છે, ફક્ત ભાર મૂકે
છે, ડેટાને બિન-ડીટર્મીનીસ્ટિક(non-deterministic)
શા માટે માનવામાં
આવે છે તે સ્પષ્ટ
કરો, ખાસ કરીને આ એક
સામાન્ય ધારણા છે;
વાસ્તવમાં, ઘણાં
ઘણા સંશોધકો માહિતી
એનાલિસિસ(analysis) કરે
છે કે ડેટાને સ્ટોકેસ્ટિક(stochastic)
બનાવવા માટે સંભવ
છે કે ક્ષણ માટે પણ
અટકાવી શકાય નહીં
અને શા માટે સ્ટોકેસ્ટિક(stochastic)
કેવા પ્રકારનું છે.
માત્ર કારણ કે મેં
સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયાની બહાર
આવતા ડેટાને ધારી
લીધું છે, હું ફક્ત
મારા ડેટા એનાલિસિસ(
data analysis)ને આગળ વધારી
શકું તેમ નથી. સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયાઓ અંદર,
ત્યાં ઘણા વર્ગીકરણ
છે અને હું મારી ધારણા
સ્પષ્ટ હોય છે. તે
બધા ધારણા પછી છે,
પરંતુ હજુ પણ મને
એ સ્પષ્ટ છે કે તે
સ્ટેશનરી સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયા, નોન-સ્ટેશનરી
સ્ટોકેસ્ટિક(non-stationery
stochastic) પ્રક્રિયા અથવા
સામયિક સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયામાંથી
બહાર આવી રહ્યું
છે કે નહીં. તેથી,
વિવિધ વર્ગો છે અને
અમારે ખૂબ જ સ્પષ્ટ
થવું જોઈએ. આ છે ... આ
તમામ નિયમિત વર્ગીકરણથી
અલગ છે કે જેને આપણે
વિચારવું જોઇએ - જે
એ છે કે શું ડેટા સ્થિર
સ્થિતિ અથવા ગતિશીલ
પ્રક્રિયામાંથી
બહાર આવે છે, રેખીય
અથવા બિન-રેખીય.
તે બધા હજુ પણ સારા
છે, પરંતુ આ એક ખૂબ
મહત્વનું વર્ગીકરણ
છે કે જે તમારે આગળ
વધવું પડશે અને, સામાન્ય
રીતે, જો તમારી પાસે
પ્રયોગની ઍક્સેસ
હોય, તો અલબત્ત, ડેટા
એનાલિસિસ( data analysis)ના
કાર્યક્ષેત્રની
બહાર છે, પરંતુ તે
તમારા પ્રયોગ દરમિયાન
સંભવિત રૂપે રેન્ડમનેસના
સ્રોતોને દબાવવા
સંબંધિત છે. તે એક
ભાગ છે, તે એક પ્રયોગ
છે જે પ્રયોગોના
ડિઝાઇનમાં વિગતમાં
કાર્યરત છે અને અમે
તે અહીં નહીં કરીએ.
સૌથી અગત્યની વસ્તુ
જે લોકો અવારનવાર
ચૂકી જાય છે - તે શરૂઆતના
છે - તે કોઈ અંદાજ
અથવા કોઈ અનુમાન
છે કે જે હું માહિતીમાંથી
દોરી રહ્યો છું - અને
મોટાભાગની માહિતીને
અવ્યવસ્થિત અથવા
સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયામાંથી
બહાર આવવાનું માનવામાં
આવે છે; તે અંદાજો
અનુમાનો પ્રકૃતિમાં
પણ રેન્ડમ છે, કારણ
કે તમે તેના દ્વારા
અનિશ્ચિતતા ધરાવતાં
ડેટા દ્વારા મૂકી
રહ્યા છો. કેટલાક
મિકેનિઝમ દ્વારા,
કેટલાક ફોર્મ્યુલા,
અમુક ગાણિતિક પ્રક્રિયા
અને તમે બહાર નીકળી
રહ્યા છો, ઉદાહરણ
તરીકે, હું નમૂનાનો
સરેરાશ ગણતરી કરું
છું. હું જાઓ અને સેન્સર(sensor)
સાથે માહિતી, આજુબાજુનો
તાપમાન ડેટા, એકત્રિત.
મારા ડેસ્કટૉપ પર
પાછા આવો અને ડેટામાં
મારા કમ્પ્યુટરમાં
અથવા મારા કેલ્ક્યુલેટરમાં
ફીડ કરો અને હું વાસ્તવમાં
નમૂના અર્થની ગણતરી
કરું છું. નમૂનાનો
મતલબ કે હું ગણતરી
કરું છું એ ફક્ત સરેરાશ
છે; શું સરેરાશ?

Kannada: 
ಪ್ರಯತ್ನಿಸಿ.
ಇವುಗಳು ಕೆಲವು ಉಲ್ಲೇಖಗಳಾಗಿವೆ.
ಖಂಡಿತ, ಇದು ಸಂಪೂರ್ಣವಾದ
ರೀತಿಯಲ್ಲಿಲ್ಲ.
ಈ ಪುಸ್ತಕಗಳಿಂದ ನಾನು
ಕೆಲವು ಉದಾಹರಣೆಗಳನ್ನು
ಮತ್ತು ಕೆಲವು ವಸ್ತುಗಳನ್ನು
ತೆಗೆದುಕೊಂಡಿದ್ದೇನೆ;
ಇವುಗಳು ಸಾಮಾನ್ಯವಾದ
ಪುಸ್ತಕಗಳಾಗಿವೆ, ಯಾದೃಚ್ಛಿಕ
ಡೇಟಾ ಅನಾಲಿಸಿಸ್ನ
ಮೊದಲ ಪುಸ್ತಕವು ನಿಮಗೆ
ತುಂಬಾ ಉಪಯುಕ್ತವಾಗಿದೆ,
ಏಕೆಂದರೆ ಇದು 30-40 ವರ್ಷಗಳ
ಕಾಲ ಅಭ್ಯಾಸ ಮಾಡಿದ
ಜನರಿಂದ ಬರೆಯಲ್ಪಟ್ಟಿದೆ,
ವಿಭಿನ್ನ ರೀತಿಯ ಡೇಟಾವನ್ನು
ಕಾಣಬಹುದು ಮತ್ತು ಅವುಗಳು
ಉದಾಹರಣೆಗಳನ್ನು ಹೊಂದಿವೆ,
ತಮ್ಮ ಪಠ್ಯ ಪುಸ್ತಕಗಳಲ್ಲಿ
ಉತ್ತಮ ಉದಾಹರಣೆಗಳು.
ಮತ್ತು ಉಳಿದ ಮೂರು,
ಕನಿಷ್ಠ ಜಾನ್ಸನ್ ಮತ್ತು
ಮಾಂಟ್ಗೊಮೆರಿ ಮತ್ತು
ರುಂಗರ್ ಪುಸ್ತಕ, ಅವರು
ಸಂಭವನೀಯತೆ ಮತ್ತು
ಅಂಕಿಅಂಶಗಳು - ಅನ್ವಯಿಕ
ಸಂಭವನೀಯತೆ ಮತ್ತು
ಅಂಕಿಅಂಶಗಳು ಶಾಸ್ತ್ರೀಯ
ಪುಸ್ತಕಗಳು.
Ogunnaike ಪುಸ್ತಕವು ನಿಮಗೆ
ಸಂಭವನೀಯತೆ ಮತ್ತು
ಎಂಜಿನಿಯರ್ಗಳಿಗೆ
ಸಂಖ್ಯಾಶಾಸ್ತ್ರದ
ಮೂಲಭೂತ ಅಂಶಗಳನ್ನು
ನೀಡುತ್ತದೆ.
ನೀವು ಎಂಜಿನಿಯರ್ ಆಗಿದ್ದರೆ,
ಪುಸ್ತಕವನ್ನು ನೋಡುವಲ್ಲಿ
ನೀವು ನಿಜವಾಗಿಯೂ ಆಸಕ್ತಿ
ಹೊಂದಿರಬಹುದು.
ಸಹಜವಾಗಿ, ನೂರಾರು
ಇತರ ಪುಸ್ತಕಗಳನ್ನು
ನೀವು ಉಲ್ಲೇಖಿಸಬಹುದು.
ಆದುದರಿಂದ, ಆಶಾದಾಯಕವಾಗಿ
ನೀವು ಉಪನ್ಯಾಸವನ್ನು
ಅನುಭವಿಸುತ್ತಿದ್ದೀರಿ
ಮತ್ತು ನೀವು ಎಲ್ಲಾ
ಬಗ್ಗೆ ಮಾಹಿತಿ ವಿಶ್ಲೇಷಣೆ
ಏನು, ನೀವು ತೆಗೆದುಕೊಳ್ಳಬೇಕಾದ
ಮುನ್ನೆಚ್ಚರಿಕೆಯ
ಕ್ರಮಗಳು, ಮತ್ತು ನೀವು
ಡೇಟಾ ವಿಶ್ಲೇಷಣೆಯಲ್ಲಿ
ಎಷ್ಟು ಎಚ್ಚರಿಕೆಯಿಂದಿರಬೇಕು,
ವ್ಯವಸ್ಥಿತ ಪ್ರಕ್ರಿಯೆ
ಏನು, ಮತ್ತು ಕೆಲವು
ಪರಿಭಾಷೆ ಎಂಬುದನ್ನು
ನೀವು ಅರ್ಥಮಾಡಿಕೊಂಡಿದ್ದೀರಿ.
ನಾವು R ನಲ್ಲಿ ಕೆಲವು
ಉದಾಹರಣೆಗಳನ್ನು ನೋಡೋಣ
ಮತ್ತು ಅದು ಈ ಉಪನ್ಯಾಸವನ್ನು
ಆಶಾದಾಯಕವಾಗಿ ಪೂರೈಸುತ್ತದೆ.
ಧನ್ಯವಾದ.

Gujarati: 
અનિશ્ચિતતા સાથે
દૂષિત ડેટા. તેથી,
તે અનિશ્ચિતતાએ તમારા
નમૂનાના અર્થ દ્વારા
પણ તેમનો માર્ગ બનાવી
દીધો છે. તેથી, નમૂનાનું
મૂલ્ય એ છે કે તમારી
પાસે કેટલીક અનિશ્ચિતતાઓ
પણ છે. અહીંની અનિશ્ચિતતા
તમારી ગણતરીની ભૂલને
અનુરૂપ નથી; તે કોરે
રાખવી જોઈએ. તેમાંની
અનિશ્ચિતતા એ હકીકત
સાથે કરી છે કે તમને
ખાતરી નથી કે આ પ્રક્રિયાના
આ સાચો અર્થ છે; તે
અનિશ્ચિતતા છે. તે
ફરી છે કારણ કે તમે
જે ડેટા એકત્રિત
કર્યો છે તે છે. તે
ઘણા શક્ય ડેટા સમૂહોમાંથી
એક છે જે તમે એકત્રિત
કરી શક્યા હોત. તેથી,
તમારી પાસે એક નમૂનાનો
અર્થ છે જેનો એક ઘણા
શક્ય નમૂનાનો અર્થ
છે કે તમે મેળવી શકો
છો. અને આ કોઈપણ પેરામીટરના
અનુમાન માટે સાચું
છે કે શું તમે ઢોળાવ,
અટકાવ અથવા અન્ય
કોઇ સંબંધનો અંદાજ
કાઢો છો, અન્ય કોઈપણ
જટીલ પરિમાણ કે જે
તમે સ્ટોકેસ્ટિક(stochastic)
ડેટાથી અંદાજો મેળવી
રહ્યા છો, તમારે યાદ
રાખવું પડશે કે ડેટામાં
એક ભૂલ છે અને વિશ્લેષક,
તે અંદાજ અથવા તમે
ચિત્રકામ કરી રહ્યાં
છો તે અંદાજમાં ભૂલ
અથવા અનિશ્ચિતતાના
કદની ગણતરી કરવા
વિશ્લેષકની જવાબદારી
છે. તે ડેટા એનાલિસિસ(
data analysis)નો એક અગત્યનો
ભાગ છે. અને આ સંદર્ભમાં,
તમારે એક અંદાજ પદ્ધતિ
પસંદ કરવી જોઈએ કે
જે તમને શક્ય તેટલી
નાની ભૂલ સાથેનો
અંદાજ આપે છે અને
અમે તેની વિગતવાર
વિગતમાં વધુ ચર્ચા
કરીશું.
વધુ અગત્યનું છે
કે તમે વધુ અને વધુ
અવલોકનો એકઠાં કરો
તો, તમારા અંદાજની
ભૂલને સંકોચાવવાનું
શરૂ કરવું જોઈએ અને
શૂન્યને અનિશ્ચિત
રૂપે જવું જોઈએ કારણ
કે એન અનંત સુધી જાય
છે. તેથી, આ કેટલાંક
માપદંડ છે અને ઘણીવાર
સંશોધકોમાંના ઘણા
આ વિશે જાણતા નથી.
તેથી, આપણે આ એનાલિસિસ(analysis)નો
છેલ્લો ભાગ જે માહિતી
એનાલિસિસ(analysis)ની પ્રક્રિયામાં
આગળ વધવું તે પહેલાં,
કેટલાક પરિભાષાઓ
સાથે ઓછામાં ઓછા
પરિચિત થવું મહત્વનું
છે જે સામાન્ય રીતે
ડેટા એનાલિસિસ( data
analysis) સાહિત્યમાં જોવા
મળે છે. અને અહીં,
અમે મુખ્યત્વે ધારીશું
કે અમે બિન-નિયતનિષ્ઠ
પ્રક્રિયાથી પ્રાપ્ત
થતી માહિતી સાથે
વ્યવહાર કરવા જઈ
રહ્યા છીએ, કારણ કે
તે પ્રચલિત પરિસ્થિતિ
સર્વત્ર છે જો તમારી
પાસે ડિટરનિસ્ટિક(deterministic)
અને સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયાના મિશ્રણ
હોય, તો આ પરિભાષા
લાગુ થાય છે. તેથી,
પહેલી પરિભાષા જે
આપણે પરિચિત થવી
જોઈએ તે શબ્દ છે - વસ્તી
અને નમૂના.
અમે જાણીએ છીએ કે
સ્ટોકેસ્ટિક(stochastic)
પ્રોસેસમાં, જેમ
આપણે પહેલાં ઉલ્લેખ
કર્યો છે, જ્યારે
આપણે ડેટા રેકોર્ડ,
ડેટાનું રેકોર્ડિંગ
કરીએ છીએ ત્યારે
તેનું અવલોકન કરીએ
છીએ.ઘણી બધી શક્યતાઓ
પૈકીની એક છે - કોઈકવાર
ગણતરીપૂર્વક મર્યાદિત
હોય છે, કેટલીક વખત
સંભવિત અનંત અથવા
અનંત હોય છે - ઘણાં
સંભવિત ડેટા રેકોર્ડ્સ
અસ્તિત્વમાં છે,
જેમાંથી આપણે એક
અવલોકન કર્યું છે;
તે સિદ્ધાંત છે, તે
સિદ્ધાંત સમગ્ર સિદ્ધાંત
પર છે. વસ્તી તમામ

Bengali: 
হ্যাঁ, অবশ্যই আমরা
একটি সঠিক অনুমান
চাই; আদর্শভাবে, আমরা
একটি সঠিক এবং একটি
সুনির্দিষ্ট অনুমান
চান।
সীমিত নমুনাগুলি
থেকে একটি সঠিক এবং
সুনির্দিষ্ট অনুমান
উভয়ই প্রাপ্ত করা
সম্ভব নয়, তবে যদি
সম্ভব হয় তবে আমরা
নিম্নতর পক্ষপাত
বা শূন্য পক্ষপাতের
সম্ভাব্যতা এবং যতটা
সম্ভব ছোট বা নিম্ন
ত্রুটির জন্য চাই।
যেহেতু অনেকগুলি
ল্যাবরেটরিতে সরবরাহ
করা হচ্ছে এমন যন্ত্রগুলিতে
আপনি দেখতে পান, আপনার
কাছে এই যন্ত্রগুলি
উচ্চ স্পষ্টতা যন্ত্রগুলির
মত যোগ্যতা আছে।
মনে রাখবেন অনুমান
কেবল তথ্য সম্পর্কে
গাণিতিক সূত্র ব্যবহার
করে না।
এমনকি একটি সেন্সর
প্রকৃতপক্ষে, এটি
আপনি দেয় যে পড়া
সত্য সত্যের একটি
অনুমান হয়।
সুতরাং, একটি খুব
বিস্তৃত দেখুন থাকতে
হবে।
সুতরাং, কোম্পানি
বা নির্মাতারা কি
উচ্চ মিছিলের যন্ত্র
দ্বারা বোঝায়, যদি
আপনি বারংবার সেন্সরের
সাথে একই ভ্যারিয়েবলটি
পরিমাপ করেন তবে
আপনি খুব বেশি পরিবর্তনশীলতা
দেখতে পাবেন না।
অবশ্যই কিছু পরিবর্তনশীলতা
থাকবে।
সুতরাং, একটি থার্মোমিটার
নিন, এবং এটি আপনার
শরীরের উপর রাখুন,
এবং পড়া গ্রহণ।
পড়া নিচে নোট।
তারপর আবার, থার্মোমিটার
নিন, তারপর শরীরের
একই অংশে রাখুন এবং
পড়া গ্রহণ।
অবশ্যই, আপনি সম্ভবত
সেখানে একই পড়া
দেখতে পাবেন, কারণ
থার্মোমিটার প্রথম
দশমিক ছাড়াও রিপোর্ট
করবেন না, তবে যদি
আপনার থার্মোমিটার
রিপোর্টিং হয় তবে
প্রকৃত পরিবর্তনশীলতাটি
দেখতে পারে চতুর্থ
বা পঞ্চম দশমিক এবং
তাই হতে পারে।
যে যন্ত্রের রেজল্যুশন
বলা হয়।
কিন্তু, যাইহোক, বিন্দু
একই ভ্যারিয়েবেল
পরিমাপ পুনরাবৃত্তি
হয় স্পষ্টভাবে আপনি
বিভিন্ন রিডিং দিতে
হবে, কিন্তু আপনি
যারা রিডিং মধ্যে
ব্যাপক বৈচিত্র চাই
না।
সুতরাং, আপনি একটি
উচ্চ স্পষ্টতা যন্ত্র
চান।
সুতরাং, যে আমরা বন্ধ
পরিভাষা বা প্রধান
পরিভাষা আসতে।
অবশ্যই, অন্য অনেক
শর্ত আছে যা এক সাথে
পরিচিত হতে চায়,
কিন্তু এটি মূল বিষয়।
আমরা যে পদ্ধতিটি
বিশ্লেষণের জন্য
অনুসরণ করতে যাচ্ছি
তার সাথে বক্তৃতাটি
শেষ করব, এবং তারপর,
R- এর কয়েকটি দৃষ্টান্তমূলক
উদাহরণের দিকে অগ্রসর
হব।
সর্ববৃহৎ জিনিস মনে
রাখতে হবে যে প্রায়
সব ডেটা বিশ্লেষণ
পদ্ধতি প্রকৃতির
পুনরাবৃত্ত হয়।
পদক্ষেপ ১, ধাপ ২,
ধাপ ৩, ধাপ ৪, সম্পন্ন
হওয়া আশা করবেন
না।
এটা যে উপায় হতে
যাচ্ছে না, খুব কমই।
সুতরাং, তারা অগত্যা
অনুক্রমিক হয় না,

Bengali: 
কিন্তু এটি একটি
নির্দিষ্ট আদেশ আছে।
এটি একটি অজ্ঞান
পদ্ধতিতে করছেন সম্পর্কে
আপনি যে মানে না এবং
মনে রাখবেন, যে কোনও
ডাটা বিশ্লেষণের
সাফল্যের দুটি জিনিস
নির্ভর করে: আপনার
সংগৃহীত তথ্য এবং
পদ্ধতিগত পদ্ধতি
বা আপনার যে পদ্ধতিগুলি
আছে, আপনি যে ডেটা
বিশ্লেষণ বা সম্পূর্ণ
পদ্ধতি পদ্ধতিতে
ব্যবহার করেছেন এমন
টুলগুলি আপনি বিশ্লেষণ
যে তথ্য বিশ্লেষণ।
যদি তথ্য মান খারাপ
হয়, আপনি অনেক কিছু
করতে পারবেন না।
এমনকি যদি আপনি পদ্ধতিগত
পদ্ধতি অনুসরণ করেন,
আপনি বিস্ময়কর ফলাফল
পাবেন না; এবং এমনকি
যদি তথ্য মান ভাল
হয়, আপনি একটি খুব
unsystematic পদ্ধতি অনুসরণ
করে এবং আপনি একটি
খুব দরিদ্র অনুমান
ব্যবহার করে, আপনি
একটি দরিদ্র শ্রোতার
সঙ্গে শেষ হতে পারে
তাই, উভয় গুরুত্বপূর্ণ।
এখন, অবশ্যই, তথ্য
গুণমান অনেক বার
আমাদের হাতে নয়,
তবে আপনি এখনও তত্ত্বটি
সম্পর্কে সচেতন থাকবেন
যখন আপনি কোনও তথ্য
দেখবেন এবং বলতে
পারবেন যে এই ডেটা
গুণমান ভাল নয়, তাই
আমি ভাল ফলাফল আশা
করা উচিত নয়।
ধরুন, আপনি পরামর্শদাতা,
আপনি কিছু তথ্য দিয়েছেন,
আপনি একটি প্রক্রিয়া
শিল্প দ্বারা বিশ্লেষণের
জন্য নিযুক্ত করা
হয় এবং আপনি কিছু
তথ্য দেওয়া হয়,
আপনি যা করা উচিত
প্রথম জিনিস একটি
তথ্য মানের তাকান
এবং আপনি আশা করতে
পারেন যে ফলাফল প্রকৃতি
কিভাবে ভাল একটি
স্বজ্ঞাত মূল্যায়ন
করা।
যদি ডেটা গুণমান
খুব খারাপ হয়, তাহলে
আপনাকে তথ্য ফেরত
দিতে হবে এবং ভালভাবে
বলতে হবে, অলৌকিক
কাজগুলি আশা করবেন
না।
তথ্য আরও ভাল ভাবে
সংগৃহীত করা উচিত,
যাতে তথাকথিত তথ্যাবলী
ঠিক আছে।
সুতরাং, মনে রাখবেন
যে মনে রাখবেন।
এখন, আমরা এই বক্তৃতা
শুরুতে দেখেছি যে
পরিকল্পিত পুনর্বিবেচনা
করে যা আমাদের কিছু
ধারণা দেয় যা ডেটা
বিশ্লেষণের পদ্ধতিগত
প্রক্রিয়া।
সুতরাং, শীর্ষে, আমরা
অবশ্যই, প্রক্রিয়াটি
থেকে বেরিয়ে আসার
তথ্য - ভাল, সেন্সরগুলির
বাইরে - এবং ডাটা বিশ্লেষণের
প্রথম ধাপটি কিছু
প্রাথমিক পদক্ষেপের
মধ্য দিয়ে যাচ্ছে
যা তিনটি বিষয়কে
অন্তর্ভুক্ত করে:
কল্পনা, মান যাচাই,
এবং প্রাক প্রক্রিয়াকরণ।
এখন আবার, এই মধ্যে,
এটি অগত্যা অনুক্রমিক
না।
সাধারণত, প্রথম ধাপে
আমাদের তথ্য চক্রান্ত
করা হয় কারণ সংখ্যাগুলি
আপনাকে অনেক কিছু
বলে না, কিন্তু ছবিগুলি
আপনাকে আরও অনেক
কিছু বলে এবং এটিতে
জোর দেয় যে আমাকে
আসলে আপনাকে এখানে
স্লাইডে নিয়ে যেতে
দিন।
এটি একটি আনসকমবি
ডেটা সেট নামে পরিচিত,
এটি একটি খুব ক্লাসিক্যাল
উদাহরণ।
এবং এই ডেটা সেট র
মধ্যে উপলব্ধ হিসাবে

Gujarati: 
શક્યતાઓને દર્શાવે
છે જે તમે જોઈ શક્યા
હોત, જોકે અમે તે અવલોકન
કરતા નથી; મોટાભાગની
પરિસ્થિતિઓમાં તે
ખરેખર શક્ય છે કે
બધી શક્યતાઓને અવલોકન
કરવી શક્ય નથી. તેથી,
વસ્તી બધા ઘટનાઓ
અથવા શક્યતાઓ સંગ્રહ
ઉલ્લેખ કરે છે. જયારે
અમે પહેલાંના વાતાવરણ
વિશે વાત કરી હતી
તે તાપમાનના સંદર્ભમાં.
જો હું સમયસર એક સેન્સર(sensor)
સાથે સો અવલોકનો
એકત્રિત કરું છું,
તો બીજી સેન્સર(sensor)
જુદી રીતે જુએ હોત;
જેથી, અન્ય ડેટા રેકોર્ડ
અશક્ય થઇ શકે છે અથવા
તે જ સેન્સર(sensor) પોતે
રેકોર્ડ કરી શક્યા
હોત, જે કંઇક સ્થિર
હતું તે સંપૂર્ણપણે
અલગ મૂલ્યો રેકોર્ડ
કરી શકે છે. તેથી,
તે શક્ય તમામ શક્ય
મૂલ્યોનો ખ્યાલ સંભવ
નથી, પરંતુ સૈદ્ધાંતિક
રીતે આ તમામ સંભવિત
જગ્યાની કલ્પના કરવી
મહત્વની છે અને અમે
તેને વસ્તી તરીકે
કહીએ છીએ જેમાંથી
આપણે એક નમૂનો મેળવીએ
છીએ. જ્યારે હું અહીં
નમૂનો કહું છું તે
એક નિરીક્ષણ નથી,
આંકડામાં એક નમૂનો
સામાન્ય રીતે અવલોકનોના
સંગ્રહનો ઉલ્લેખ
કરે છે. તે મૂળભૂત
રીતે એક ડેટા રેકોર્ડનો
ઉલ્લેખ કરે છે, પરંતુ
સિગ્નલ પ્રોસેસિંગમાં,
એક નમૂના તાત્કાલિક
એક મૂલ્ય હોઇ શકે
છે અને તે નિર્ધારિત
વિશ્વમાં છે. આ વસ્તી
અને નમૂનાના અનુરૂપ,
આપણી પાસે સત્ય અને
એક અંદાજ છે. અમે હમણાં
જ કહ્યું હતું કે
વસ્તી બધી શક્યતાઓનો
સંગ્રહ છે, પરંતુ
તે સત્ય દ્વારા વર્ગીકૃત
થયેલ છે તેથી, આ સમગ્ર
વસતીમાં, ઉદાહરણ
તરીકે, ચોક્કસ અર્થ
છે ચાલો આપણે કહીએ,
હું જૂથના સરેરાશ
પગારને જોઈ રહ્યો
છું - એક વય જૂથના
- ખૂબ મોટા દેશમાં,
ચાલો આપણે કહીએ કે
ખૂબ મોટી પેઢીમાં.
મને જવાનું અને દરેકને
પૂછવું શક્ય નથી.
વ્યાવહારિક કારણોસર,
હું માત્ર થોડા લોકો
જ તેમના પગાર વિશે
આ માહિતી એકત્રિત
કરવા માટે પૂછો અને
જેમાંથી હું સાચું
એવરેજ પગાર અનુમાન.
તેથી, સાચી સરેરાશ
વેતન એક સત્ય છે, તે
વસ્તીનું નિરૂપણ
કરે છે - તે વય જૂથ
- અને અંદાજ એ છે કે
હું માહિતીમાંથી
શું મેળવું છું. દેખીતી
રીતે, અંદાજ હંમેશા
સત્યથી અલગ હશે કારણ
કે મેં બધી શક્યતાઓ
જોઇ નથી. અને અંદાજ
સિદ્ધાંત તમને જણાવે
છે કે કેવી રીતે રુચિના
માપદંડનો અંદાજ કાઢવો,
કાર્યક્ષમ સુસંગત
રીતે, રેકોર્ડ કરેલ
ડેટામાંથી.
આ સાથે જોડાયેલા,
અમારી પાસે આ અંદાજ
છે તમારી પાસે આ શરતો
આંકડાકીય અને અંદાજપત્ર
કહેવાય છે. આંકડાકીય
તમારા અવલોકનોનો
ગાણિતિક કાર્ય છે
પરંતુ તે કંઈ નથી.
ફરીથી, નમૂનાનું
અર્થ એ આંકડાકીય
છે; નમૂનો અંતર આંકડાકીય
છે. તે ફક્ત એક ગાણિતિક
ક્રિયા છે જે તમે
અવલોકનો પર કરી રહ્યા
છો. એક અંદાજ પણ ગાણિતિક
કાર્ય છે. તમે કહી
શકો છો કે તે એક નરમ
ઉપકરણ અથવા આભશી
ઉપકરણ છે જે ડેટાને
ગાણિતિક રીતે ચલાવે
છે અને તમે જે ઇચ્છો
તેનો અંદાજ કાઢે
છે. આંકડાકીય અને
અંદાજપત્ર વચ્ચેનો

Bengali: 
অনেক তথ্য সেট যে
আপনি যখন ইনস্টল
সঙ্গে এটি আসে।
এখন, এই Anscombe তথ্য সেট
সৌন্দর্য হয় ... আমাকে
আপনি এখানে দেখান
কি ব্যাখ্যা করা
যাক।
আমার চারটি ডেটা
এখানে আছে, ভেরিয়েবলের
জোড়া; x1 y1, x2 y2, x3 y3 এবং
x4 y4 মনে হয়।
তারা সব দৃশ্যত খুব
ভিন্ন দেখায়; যাইহোক,
যদি আপনি ডেটা দেখে
না থাকেন, এবং আপনি
গণনা করেছিলেন, উদাহরণস্বরূপ,
অর্থ বা বৈকল্পিকতা
বা আপনি সম্পর্কিত
জোড়াগুলির মধ্যে
একটি মডেল বা একটি
পারস্পরিক সম্পর্কের
মধ্যে গণনা করেছেন,
তবে তারা সবাই একই
হবে, তারা সবাই একই
হবে।
সুতরাং, বর্ণনামূলক
পরিসংখ্যান বা এমনকি
আপনার রিগ্রেশন উপর
ভিত্তি করে, আপনি
এই চার তথ্য সেট মধ্যে
কোন পার্থক্য করতে
সক্ষম হবে না।
যাইহোক, আপনি দেখতে
পারেন, এই তথ্য প্রতিটি
বৈশিষ্ট্য মধ্যে
যেমন একটি ব্যাপক
পার্থক্য আছে।
উদাহরণস্বরূপ, যদি
আপনি ডাটা সেটটি
২ এ দেখেন, তবে একটি
পারবোলিক ধরনের সম্পর্ক
রয়েছে, যদিও ডাটা
সেট ৪, সমস্ত পয়েন্টগুলি
একটি সরল রেখায়
পড়ে।
বাস্তবিকই, x- এ কোন
পরিবর্তন নেই, শুধুমাত্র
y এক বাহির থেকে পৃথক
হয়।
সুতরাং, এই ডেটা সেটটি
আপনার ডেটা বিশ্লেষণের
জন্য কোনও আউটলাইয়ারগুলি
করতে পারে তা আপনাকে
দেখানোর জন্য খুব
উপযোগী।
Outliers যে তথ্য পয়েন্ট
যে স্বাভাবিক জিনিস
থেকে পড়ে বা যে অঞ্চলের
যে ডেটা বাকি বাকি
থেকে বেরিয়ে আসলে,
যদি আপনি ডাটা সেট
3 দেখেন, তবে সব ডাটা
পয়েন্টগুলি একটি
সরাসরি লাইনের উপরে
থাকে তবে একটি ডাটা
বিন্দু ব্যতীত এটি
একটি বহিরাগত ডান।
সুতরাং, যখন আপনি
বর্ণনামূলক পরিসংখ্যানটি
দেখেন তখন দুইটি
ডেটা সেট সম্পূর্ণরূপে
একরকম দেখতে পারে,
যখন আপনি তাদের চক্রান্ত
করেন, আপনি জানেন
যে একটি বিশাল পার্থক্য
রয়েছে।
এবং তারপর, অবশ্যই,
আমরা সংশোধনমূলক
ব্যবস্থা গ্রহণ করব
এবং সঠিক পদক্ষেপগুলি
সঠিকভাবে খুঁজে বের
করতে সক্ষম হব তাই,
আশা করা যায় যে এটি
কোন ডেটা বিশ্লেষণের
আগে তথ্য আদান-প্রদানের
প্রয়োজনীয়তা ঘটাবে।
এবং তারপর, অবশ্যই,
আমরা একটি মানের
চেক করেছি।
উদাহরণস্বরূপ, আমরা
outliers উপস্থিতি নিরীক্ষণ।
এটা খুবই গুরুত্বপূর্ণ।
অনেক সময় তথ্য অনুপস্থিত
মান সঙ্গে আসা।
আপনি নিখোঁজ মূল্যবোধ
সঙ্গে মোকাবেলা কিভাবে
সিদ্ধান্ত নিতে হবে।
আপনি এটি প্রতিস্থাপন
বা এটি সঙ্গে বাস
করা উচিত কিনা একটি
সম্পূর্ণ প্রচুর
তত্ত্ব আছে, interpolate,
এবং তাই।
তাই স্পষ্টতই, এটি
সম্পর্কে এখানে কথা
বলা সম্ভব নয়।
এবং তারপর, অন্যান্য
প্রকার প্রক্রিয়াকরণ
যা আপনাকে করতে হবে।

Gujarati: 
તફાવત એકદમ સૂક્ષ્મ
છે. પ્રથમદર્શીતા
તે સમાન જણાય છે, પરંતુ
તફાવત એ છે કે આંકડાકીય
માત્ર એક જ ગાણિતિક
કાર્ય છે, જે કોઈપણ
હેતુ માટે જરૂરી
નથી. જ્યારે, એક અંદાજ
એ એક ગાણિતિક પ્રક્રિયા
છે જે ચોક્કસ હેતુથી
ધ્યાનમાં રાખીને
કોઈ ચોક્કસ હેતુ
સાથે હાથ ધરવામાં
આવે છે. તેથી, જો તમે
અંદાજ સિદ્ધાંતમાં
વધુ નીચે જાઓ છો, તો
તમે આંકડાકીય અને
અંદાજકાર વચ્ચે આ
તફાવત પર વધુ ચર્ચા
જોશો, પરંતુ જ્યાં
સુધી ગાણિતિક કામગીરી
સુધી, બંને ડેટાના
ગાણિતિક કાર્યો છે.
તેથી, અંદાજ સિદ્ધાંતમાં,
અમે આંકડા અને અંદાજોનો
ઘણીવાર ઉપયોગ કરીએ
છીએ. તેથી, નમૂનાનું
અર્થ એ બંને આંકડાકીય
અને સાચા અર્થના
બરાબર એક અંદાજકાર
છે, કારણ કે સાચા અર્થના
અંદાજ માટે નમૂનાનો
અર્થ તૈયાર કરવામાં
આવ્યો છે, અને ફરીથી
સંકળાયેલ; જેમ તમે
જોઈ શકો છો કે તે વસ્તી
અને નમૂના વિશે બધું
છે; તમારી પાસે દાગીનો
અને નમૂનો સરેરાશ
છે
એન્સેમ્બલ એવરેજ(Ensemble
average) એ એવી એવરેજ છે
કે તમે બધા શક્ય મૂલ્યોની
ગણતરી કરી શકો છો
જે તમે ક્યારેય જોઈ
શક્યા હોત, જે, અલબત્ત,
આપણે ક્યારેય ન જોઈ
શકીએ; મોટાભાગની
પરિસ્થિતિઓમાં આપણે
તમામ સંભવિત ડેટા
રેકોર્ડ્સ અથવા પગારના
ઉદાહરણમાં ક્યારેય
એકત્રિત થવું નહી
મળે, તે શક્ય એટલું
શક્ય નથી કે તમામ
શક્ય લોકોના અર્થપૂર્ણ
સમયમાંથી ડેટા એકત્રિત
કરવો, નમૂનાની સરેરાશ,
અલબત્ત, ફક્ત સરેરાશ
ગણતરી કરવામાં આવે
છે આ નમૂનાઓમાંથી.
અને આ સરેરાશનો ઉપયોગ
એગોડિક(ergodic) પ્રક્રિયા
તરીકે ઓળખવામાં આવે
છે તે વ્યાખ્યાયિત
કરવા માટે થાય છે.
આપણે તેમાં જઈશું
નહીં છેલ્લે, બે શરતો
બાયસ અને વરિયાબીલિટી
(bias and variability) ડેટા એનાલિસિસ(
data analysis)માં ખૂબ મહત્વપૂર્ણ
છે કારણ કે તેઓ બન્ને
ભૂલ વિશે વાત કરે
છે કે જે કેટલાક પરિમાણો
અથવા પરિમાણોના સમૂહનો
અંદાજ કાઢે છે. બાયસ
(bias) એક વ્યવસ્થિત
ભૂલ છે કે જે કોઈના
થી થઇ શકે છે; દરેક
અંદાજ અભ્યાસ તમને
અંદાજ આપશે જે ભૂલમાં
છે; તે વિશે કોઈ શંકા
નથી. પ્રશ્ન એ છે કે
શું અંદાજ અને સત્ય
વચ્ચેનો તફાવત તક
દ્વારા અથવા તમારા
અંદાજકારની અછત અથવા
અછતને કારણે છે. તમારા
અનુમાન કવાયતમાં
અથવા તમારા અંદાજમાં
પૂર્વગ્રહ હોય તો
તમે કેવી રીતે જાણો
છો?
આ વિચાર પ્રક્રિયા
કલ્પના; મેં એકત્રિત
કર્યું છે, ચાલો એક
માહિતી માટે સો ડેટાનું
રેકોર્ડ અથવા હજાર
ડેટા રેકોર્ડ અથવા
હજાર ડેટા રેકોર્ડ્સ
અને હું દરેક ડેટા
રેકોર્ડ્સ માટે નમૂના
સરેરાશની ગણતરી કરું
છું. જો હું સરેરાશ,
ચાલો કહીએ, હજાર પણ
નથી, લગભગ દસ લાખ ડેટા
રેકોર્ડ્સ, ડેટા
રેકોર્ડ દીઠ મારી
પાસે એક નમૂનાનો
અર્થ છે; અને મિલિયન
ડેટા રેકોર્ડ્સ માટે,
તેથી મારી પાસે મિલિયન
સેમ્પલનો અર્થ છે.
જો હું સેમ્પલનો
સરેરાશ કરતો હોઉં
તો, મિલિયન નમૂનાનો
અર્થ એ કે મારી પાસે
છે, હું સત્યની ખૂબ
જ નજીક હોવા જોઈએ.

Gujarati: 
જો ત્યાં માત્ર મિલિયન
શક્યતાઓ છે, મને સત્ય
મળવું જોઈએ, પરંતુ
જો ત્યાં તફાવત છે
કે જે હજુ પણ આ મિલિયન
નમૂના સરેરાશ અથવા
નમૂના અર્થ અને સત્ય
ની સરેરાશ વચ્ચે
અસ્તિત્વમાં છે,
પછી ત્યાં એક પદ્ધતિસરની
ભૂલ છે આ દાગીનાની
સરેરાશ જે આપણે વિશે
વાત કરી હતી, જેમ મેં
ઉપર લખ્યું છે, તેને
પણ અપેક્ષા તરીકે
પણ ઓળખવામાં આવે
છે. તેથી બીજા શબ્દોમાં
કહીએ તો, જો પૂર્વગ્રહ
પર પાછા આવવું, જો
અંદાજની અપેક્ષિત
મૂલ્ય સત્યથી અલગ
છે, તો અમે કહીએ છીએ
કે અંદાજમાં પૂર્વગ્રહ
છે. હવે, ચલનતામાં
આવતા, તે વિવિધ ડેટા
રેકોર્ડ્સમાં અંદાજોના
ફેલાવોનો એક માપ
છે. તે ખૂબ જ મહત્વપૂર્ણ
છે, કારણ કે વ્યવહારમાં
હું માત્ર એક ડેટા
રેકોર્ડ સાથે કામ
કરું છું અને હું
એક જ ડેટા રેકોર્ડમાંથી
મારા બધા અનુમતિઓ
બનાવે છે. મને જાણ
કરવાની જરૂર છે, મને
પ્રશ્નના જવાબને
જાણવાની જરૂર છે
- મેં અન્ય ડેટા રેકોર્ડ્સનો
સંગ્રહ કર્યો હતો,
અને મેં ડેટા રેકોર્ડમાંથી
સંદર્ભોને દોર્યા
હતા, તો તે દાખલાઓ
મેં જે જોયેલા છે
તેનાથી નોંધપાત્ર
રીતે અલગ હશે. તેઓ
જુદા જુદા હશે, દેખીતી
રીતે, આંકડાકીય રીતે,
પરંતુ શું તફાવત
ઘણો મોટો હશે?
અને જો તે ખૂબ મોટી
છે, તો અમે કહીએ છીએ
કે આ અંદાજમાં અથવા
અંદાજમાં મોટા પાયે
ચલન છે. આ કારણોસર,
ચલનને ચોકસાઇ તરીકે
પણ ઓળખવામાં આવે
છે. અનુમાનમાં અસમાનતા
નીચુ, વધુ ચોક્કસ
છે અંદાજ.
તેનાથી વિપરીત, પૂર્વગ્રહ
પગલાં ચોકસાઈ.
પૂર્વગ્રહને ઓછી
કરો, અચોક્કસતા.
હકીકતમાં, શૂન્ય
પૂર્વગ્રહનો અર્થ
થશે, તે ચોક્કસ છે;
અંદાજ એ ચોક્કસ છે
કે તમે સત્યનો ચોક્કસ
અંદાજ આપે છે. લાક્ષણિક
રીતે, અમે ચલન વિશે
વધુ ચિંતાતુર છીએ.
હા, અલબત્ત અમે એક
ચોક્કસ અંદાજ કરવા
માંગો છો; આદર્શ રીતે,
અમે ચોક્કસ અને અચોક્કસ
અંદાજ માગીએ છીએ.
મર્યાદિત નમુનાઓથી
એક ચોક્કસ અને ચોક્કસ
અંદાજ બંને પ્રાપ્ત
કરવું શક્ય નથી, પરંતુ
જો શક્ય હોય તો ચોક્કસપણે
આપણે ઓછી પૂર્વગ્રહ
અથવા ઝીરો પૂર્વગ્રહ
કરવો જોઈએ, અને શક્ય
તેટલી નાની અથવા
ઓછી ભૂલ તરીકે.
એટલા માટે તમે પ્રયોગશાળાઓ
માટે પૂરા પાડવામાં
આવતા ઘણા સાધનો પર
જોશો, તમારી પાસે
આ સાધનો ઉચ્ચ ચોકસાઈવાળા
સાધનો તરીકે લાયક
છે. યાદ રાખો, અનુમાન
ફક્ત ડેટા પર ગાણિતિક
સૂત્રનો ઉપયોગ કરતી
નથી. વાસ્તવમાં સેન્સર(sensor)
પણ, તે જે વાંચન આપે
છે તે સત્યનો એક અંદાજ
છે. તેથી, એક ખૂબ વ્યાપક
દેખાવ હોવો જોઈએ.
તેથી, કંપની અથવા
ઉત્પાદક એટલે ઉચ્ચ
સરઘસ સાધન દ્વારા
શું અર્થ થાય છે, જો
તમે વારંવાર સેન્સર(sensor)
સાથે સમાન વેરિયેબલને
માપવા માંગતા હો,
તો તમને વધુ વૈવિધ્યતા
દેખાશે નહીં. ચોક્કસપણે
કેટલાક ચલન હશે તેથી,
થર્મોમીટર લો, અને
તેને તમારા શરીર
પર મૂકો અને વાંચન
વાંચો.
વાંચન નીચે નોંધ
કરો. પછી ફરીથી, થર્મોમીટર
લો, પછી તે શરીરના
જ ભાગ પર મૂકો અને

Bengali: 
উদাহরণস্বরূপ, আপনি
মাল্টিভারাইয়াম
প্রসেসে সময় স্ট্যাম্প
সিঙ্ক করতে হতে পারে;
যেখানে আপনি বিভিন্ন
ভেরিয়েবল থেকে তথ্য
সংগ্রহ করেন, আপনাকে
সময় স্ট্যাম্পগুলি
সঙ্কুচিত করতে হতে
পারে অথবা কখনও কখনও
এক পরিবর্তনশীল একটি
স্যাম্পলিং হারে
সংগৃহীত হয়, আরেকটি
পরিবর্তনশীল অন্য
স্যাম্পলিং হারে
সংগৃহীত হয়, তারপর
আপনাকে প্রাক প্রক্রিয়াটি
কীভাবে নির্ধারণ
করতে হয়।
কখনও কখনও, আসলে, অনেক
বার তথ্য গোলমালের
সাথে আসে এবং অন্য
কোনও ধাপের আগে আমাদেরকে
বিশ্লেষণের জন্য
আমরা হয়তো শব্দটি
সরিয়ে ফেলতে পারি,
কারণ শব্দটি সত্যিই
আমরা যে তথ্যগুলি
আঁকতে পারি সেগুলি
হাইজ্যাক করতে পারে।
এটি ডাটা বিশ্লেষণের
কোর্স উল্লেখযোগ্যভাবে
প্রভাবিত করতে পারে
সুতরাং, আমরা শব্দটি
ফিল্টার করতে চাইতে
পারি।
তাই, অনেক, আপনি এই
প্রাথমিক পদক্ষেপ
যা সম্ভবত সবচেয়ে
গুরুত্বপূর্ণ যা
সময় ব্যয় করতে
চান অনেক কারণ আছে।
কিছুটা ... এর মধ্যে
কিছুটা মাতলামি রয়েছে।
এটা সত্যিই আপনার
স্নায়ু পেতে পারে,
এবং একটি সুবর্ণ
৮০/২০ শাসন আছে যা
শতকরা ১০০ শতাংশ
বলে যে এটি সামগ্রিক
তথ্য বিশ্লেষণের
জন্য লাগে, আপনাকে
৮০ শতাংশ সময় ব্যয়
করতে হতে পারে প্রাক
প্রক্রিয়াকরণ তথ্য।
যে ধরনের প্রচেষ্টার
জন্য আপনাকে মাঝে
মধ্যে থাকতে হবে
আপনি ভাগ্যবান, অবশ্যই,
আপনি শুধু একটি হাওয়া
এই পদক্ষেপ মাধ্যমে
পাস যেতে পারেন তারপর
আসে, অবশ্যই, আপনার
বিশ্লেষণের মূল অংশ
হচ্ছে মডেলিং বা
অনুমান বা অনুসন্ধানী
বা ভবিষ্যদ্বাণীপূর্ণ
বা প্রজ্ঞাপূর্ণ
ধরনের বিশ্লেষণ নির্ণয়ের
এবং এরকম ফলাফল, যা
অনেকগুলি অ্যাপ্লিকেশনের
মধ্যে নিয়ন্ত্রণ
করে, যেমন পর্যবেক্ষণ,
নিয়ন্ত্রণ, অপ্টিমাইজেশান
, আমরা আগে আলোচনা
করেছেন হিসাবে নতুনত্ব।
এখন, খুব গুরুত্বপূর্ণভাবে,
এই সব পদক্ষেপে, আপনাকে
দুটি বিষয় মনে রাখতে
হবে।
তীর হিসাবে নির্দেশ
করে এমন একটি হিসাবে,
এটি অপরিহার্যভাবে
রৈখিক নয়।
এর মানে, কখনও কখনও
আপনাকে ফিরে যেতে
হতে পারে।
তাই, যদি আমি জানতে
পারি যে ডেটা গুণমান
দরিদ্র, তবে আমার
পরীক্ষার দিকে ফিরে
যেতে হবে অথবা এমন
ব্যক্তি যিনি আমাকে
আরও ভাল তথ্য দিতে
ডেটা দিয়েছেন বা
আমি জানতে পারি যে
আমি যে বৈশিষ্ট্যগুলি
চাই তা ডেটাতে উপস্থিত
নয়, আমি পরীক্ষা
পুনরায় করতে বা
অনুমান করার পরে
থাকতে পারে আমি তথ্য
গুণ যথেষ্ট ভাল না
বা আমি যথেষ্ট প্রি
প্রসেসিং না করেছিলাম,
আমি ফিরে যেতে হতে
পারে এবং আরও যে দেখাতে
পারে।
এটা প্রথম বিন্দু।
এবং দ্বিতীয় পয়েন্ট
হল যদি আপনার কোন
ডোমেন জ্ঞান আছে,
এবং যে খুব, খুব গুরুত্বপূর্ণ;

Bengali: 
স্পষ্টতই, আপনি যেখানে
তথ্য আসছে তা জানা
উচিত, এটি জৈবিক প্রক্রিয়া,
একটি অর্থনীতি পদ্ধতি
বা প্রকৌশল প্রক্রিয়া
বা কিছু সোশাল মিডিয়ার
প্রক্রিয়া এবং তাই
... বা একটি রাসায়নিক
প্রক্রিয়া এবং তাই
থেকে আসছে।
যে তথ্যটি আপনার
ডেটার জন্য স্যাম্পলিং
রেট হওয়া উচিত তা
বেছে নেওয়ার সাথে
সাথে প্রতিটি ধাপেও
এই তথ্যটি বিবেচনা
করা উচিত - এভাবে আপনার
কতগুলি তথ্য সংগ্রহ
করা উচিত; যে যেখানে
ডোমেন জ্ঞান আপনার
যাত্রা শুরু।
এবং যদি আমি জানি,
উদাহরণস্বরূপ, আমি
একটি পিএইচ সিস্টেম
এ খুঁজছেন, আমি জানি
এটি একটি অ লিনিয়ার
সিস্টেম অধিকার।
তারপর যখন মডেলিং
পর্যায়ে, আমি রৈখিক
মডেল নির্মাণের এমনকি
চিন্তা করা উচিত
নয়, কিন্তু ডেটা
থেকে আসছে যেখানে
আমি জানি না, এটি একটি
ডেটা সেট অবশেষ এবং
এটি আমার সীমিত ব্যবহার
করে, এটি শুধু কিছু
ধরনের একটি খেলনা
যে আমি সঙ্গে চারপাশে
খেলা হয়।
সুতরাং, সর্বোপরি
সম্ভাব্য উপায়ে
প্রতিটি পর্যায়ে
ডোমেন জ্ঞান ব্যবহার
করতে হবে এবং অবশ্যই,
আপনার কতটুকু ডোমেন
জ্ঞান আছে তা নির্ভর
করে।
এটি মডেলের গঠন নির্বাচন
করতে আপনাকে সাহায্য
করতে পারে, আপনি যে
ধরণের বৈশিষ্ট্যগুলি
সন্ধান করতে চান
বা যে শব্দটি আপনি
আশা করতে পারেন - এটি
একটি সেন্সর গোলমাল
বা একটি প্রসেসের
শব্দ এবং এটির মতো,
এমনকি আপনার অ্যাপ্লিকেশনেও
। সুতরাং, এটা মনে
রাখা উচিত প্রকৃতির
সমস্ত-রক্ষণাবেক্ষণ,
কিন্তু এটি একটি
নির্দিষ্ট systematizm আছে
- সঠিকভাবে আপনার
মডেল নির্বাচন করুন
এবং আপনি তথ্য গুণমান
চেক মাধ্যমে যেতে
নিশ্চিত করা; তথ্য
কল্পনা করুন; প্রাক
প্রক্রিয়া; তারপর
আপনার মডেল সঠিকভাবে
চয়ন করুন, আপনি মডেল
নির্মাণ করা হয়
এবং তাই।
আমরা যে মডেলিং দক্ষতা
বা অনুমান সঠিকভাবে
এবং আরও উপর পরবর্তী
বক্তৃতা সম্পর্কে
যে বিষয়ে কথা হবে।
সুতরাং, আমরা এখন
এটি আরও একটি আরো
প্রসারিত হবে।
সুতরাং, আমরা তথ্য
বিশ্লেষণে এগিয়ে
যাওয়ার আগে, প্রথম
ধাপ হিসাবে আমরা
শিখেছি, কিছু প্রাথমিক
প্রশ্ন জিজ্ঞাসা
করা হয়।
কী ধরণের বিশ্লেষণ
প্রয়োজন?
এটি বর্ণনামূলক,
ভবিষ্যদ্বাণীপূর্ণ
এবং তাই কিনা, কারণ
এটি বিশ্লেষণের সম্পূর্ণ
কোর্স পরিবর্তন করে
তথ্য কোথা থেকে আসে?
তথ্য সোর্স - আমাদের
শুধু জিজ্ঞাসা আছে,
আমরা সময় ডোমেন
আছে, তথ্য ফ্রিকোয়েন্সি
ডোমেন, তথ্য জৈব প্রক্রিয়া
তথ্য এবং তাই।
কিভাবে তথ্য অর্জিত
হয়েছিল?
কি ধরনের হার্ডওয়্যার
ব্যবহার করা হয়েছিল?
এটি একটি মানুষ যারা
তথ্য সংগ্রহ করে?
এটি একটি সেন্সর
ছিল?
যদি এটি একটি সেন্সর
হয়, তাহলে নমুনা

Gujarati: 
વાંચન લે છે. અલબત્ત,
તમે કદાચ ત્યાં જ
વાંચન જોશો, કારણ
કે થર્મોમીટર્સ પ્રથમ
દશાંશની બહારની જાણ
કરતા નથી, પરંતુ જો
તમારી પાસે થર્મોમીટરની
રિપોર્ટિંગ હોય તો
તમે વાસ્તવિક અસમર્થતા
જોઈ શકો છો ચોથું
કે પાંચમી દશાંશ
અને તેથી વધુ. તે સાધનનું
રીઝોલ્યુશન(resolution)
કહેવાય છે પરંતુ,
કોઈપણ રીતે, તે જ ચલણનું
માપ વારંવાર માપવાથી
તમને વિવિધ રીડિંગ્સ
આપશે, પરંતુ તમે તે
રીડિંગ્સમાં વિશાળ
વિવિધતા જોઈએ નહીં.
તેથી, તમે એક ઉચ્ચ
ચોકસાઇ સાધન માંગો
છો. તેથી, તે સાથે
અમે નજીકની પરિભાષા
અથવા મુખ્ય પરિભાષામાં
આવીએ છીએ. અલબત્ત,
એવા ઘણા અન્ય શબ્દો
છે જે એક સાથે પરિચિત
થવા માંગે છે, પરંતુ
તે મૂળભૂત બાબતો
છે. અમે લેક્ચરને
પ્રક્રિયા સાથે સમાપ્ત
કરીશું જે ડેટા એનાલિસિસ(
data analysis) માટે અનુસરવાની
જરૂર છે, અને તે પછી,
આર(R) માં બે ઉદાહરણ
ઉદાહરણો પર આગળ વધો.
યાદ રાખવા માટેની
સૌથી મહત્વની બાબત
એ છે કે લગભગ તમામ
ડેટા એનાલિસિસ( data
analysis) પ્રક્રિયાઓ પ્રકૃતિ
પુનરાવર્તન છે. પગલું
1, પગલું 2, પગલું 3, પગલું
4, પૂર્ણ થવાની અપેક્ષા
રાખશો નહીં. તે ક્યારેય
એવું નથી બનશે, ખૂબ
જ ભાગ્યે જ તેથી, તે
અનુક્રમે આવશ્યક
નથી, પરંતુ તેમાં
ચોક્કસ હુકમ છે. તેનો
અર્થ એ નથી કે તમે
એક અજાણ્યા રીતે
કરી રહ્યા છો અને
એ પણ યાદ રાખો કે કોઈપણ
ડેટા એનાલિસિસ( data
analysis) કવાયતની સફળતા
બે બાબતો પર આધારિત
છે: તમે જે ડેટા એકત્રિત
કરો છો અને વ્યવસ્થિત
પ્રક્રિયા અથવા તમારી
પાસે જે પદ્ધતિઓ
છે, તે સાધનો કે જે
તમે ડેટા એનાલિસિસ(
data analysis) અથવા સંપૂર્ણ
પદ્ધતિની પદ્ધતિમાં
ઉપયોગમાં લીધેલ છે.
તમે એનાલિસિસ(analysis)
કર્યું તે ડેટા એનાલિસિસ(
data analysis) જો ડેટા ગુણવત્તા
ખરાબ છે, તો તમે વધુ
કરી શકતા નથી. જો તમે
પદ્ધતિસરની પ્રક્રિયાને
અનુસરશો તો પણ તમે
આશ્ચર્યકારક પરિણામો
મેળવી શકશો નહીં;
અને જો માહિતીની
ગુણવત્તા સારી હોય
તો પણ તમે ખૂબ જ બિનઆધારિત
પ્રક્રિયાને અનુસરી
શકો છો અને તમે ખૂબ
જ હલકા અંદાજનો ઉપયોગ
કરો છો, તમે હલકા અંદાજકાર
સાથે અંત કરી શકો
છો. તેથી, બંને મહત્વપૂર્ણ
છે. હવે, અલબત્ત, માહિતીની
ગુણવત્તા ઘણાં વખત
આપણા હાથમાં નથી,
પરંતુ તમે હજી પણ
સિદ્ધાંત વિશે જાણતા
હોવ જ્યારે તમે કોઈ
ડેટા પર નજર રાખશો
અને કહેશો કે આ ડેટા
ગુણવત્તા સારી નથી,
તેથી મને સારા પરિણામોની
અપેક્ષા ન રાખવી
જોઈએ. ધારો કે, તમે
કન્સલ્ટન્ટ છો, અને
તમને અમુક માહિતી
આપવામાં આવી છે, તમે
પ્રક્રિયા ઉદ્યોગ
દ્વારા ડેટા એનાલિસિસ(
data analysis) માટે ભાડે લીધેલ
છો અને તમને અમુક
ડેટા આપવામાં આવે
છે, તમારે જે કરવું
જોઈએ તે પ્રથમ વસ્તુ
ડેટાની ગુણવત્તા
પર નજર રાખે છે અને
પરિણામોની પ્રકૃતિ
છે કે જે તમે અપેક્ષા
રાખી શકો છો તે કેટલી
સારી છે તે વિશેની
સાહજિક આકારણી કરો.
જો ડેટા ગુણવત્તા
ખૂબ ખરાબ છે, તો તમારે
ડેટા પાછો આપવો જોઈએ
અને કહેવું જોઈએ
કે ચમત્કારોની અપેક્ષા

Bengali: 
হার কি ছিল?
তাই অনেক প্রশ্ন
আমাদের জন্য বিশ্লেষণের
একটি মান কিভাবে
ভাল আশা করতে পারেন
বলতে সক্ষম হতে পারে,
এবং আমার ব্যবহার
করা উচিত যে ধরনের
বিশ্লেষণ সরঞ্জাম
কি হওয়া উচিত, এবং
আমার কি জন্য অনুসন্ধান
করা উচিত?
এবং তারপর, অবশ্যই,
কিভাবে তথ্যপূর্ণ
তথ্য - এটি একটি বিট
গুণগত, কিন্তু তথ্য
নির্দিষ্ট পরিমাণগত
ব্যবস্থা আছে।
আমরা এটির সম্পর্কে
কথা বলব না, কিন্তু
আমি যেমন বলেছি, এটি
মূলত মানের মানদণ্ডের
সাথে সম্পর্কযুক্ত
কিনা তা ডেটা আউটলাইয়ের
অনুপস্থিত এবং তাই।
এবং শেষ পর্যন্ত,
কিন্তু সম্ভবত সবচেয়ে
গুরুত্বপূর্ণ - ডেটা
উত্পাদক প্রক্রিয়া
উপর কি অনুমান করা
হচ্ছে স্পষ্ট করা
উচিত।
আপনি ভুল হতে পারে।
প্রারম্ভে, আমরা
ভুল অনুমান করতে
পারি, আমরা একটি স্টকাস্টিক
প্রক্রিয়ার ধারণা
নির্ণয়মূলক হতে
পারি, আমরা একটি অরৈখিক
প্রক্রিয়া অনুমান
করতে পারি যা রৈখিক,
একটি স্থির অবস্থা
প্রক্রিয়া গতিশীল
এবং তাই; এটা সম্ভব.
কিন্তু আমরা তথ্য
বিশ্লেষণ জুড়ে আমরা
তৈরি করা অনুমান
যে লাঠি করা উচিত,
এবং চয়ন করুন এবং
সঙ্গতিপূর্ণ এবং
সমরূপ হতে - আমরা সঠিক
সরঞ্জাম নির্বাচন
করা উচিত এবং তাই,
যাতে আপনি যদি একটি
ভুল করেছেন, শেষে,
আমরা জানি যে আমরা
একটি ভুল করেছেন
এবং তারপর, আমরা ফিরে
যান, এবং সংশোধন করা।
এবং আমি সত্যিই এই
বিস্তারিত মধ্যে
যেতে যাচ্ছে না।
আমরা ইতিমধ্যে এটি
সম্পর্কে বললাম।
সুতরাং, একবার আপনি
প্রাথমিক প্রশ্নের
মাধ্যমে, আমরা আমাদের
ডেটা প্রস্তুত, অনেক
তথ্য প্রাক প্রক্রিয়াকরণ
পদক্ষেপের মাধ্যমে;
ডেটা কি ধরনের সমস্যা
উপর নির্ভর করে।
উদাহরণস্বরূপ, যদি
ডাটা আউটলাইয়ার
হয়, আমি বলতে চাচ্ছি,
আমি পরিষ্কার করতে
হবে, কিন্তু শক্তিশালী
পদ্ধতিও আছে।
আমরা বলি আউটলাইয়ারগুলি
ডেটাতে থাকুক এবং
এখনও আপনাকে ভাল
অনুমান পেতে এবং
এভাবে, অথবা আমাদের
ফিল্টার করতে হবে
এবং আরও কিছু করতে
হবে।
যে জিনিসটি আমি আগেই
উল্লেখ করেছিলাম
না তা ডেটা ভাগ করা।
যদি আপনি একটি মডেল
নির্মাণ করা হয়
বা আপনি বৈশিষ্ট্য
এবং অন্যান্য দ্বারা
শ্রেণীভুক্ত করা
হয় তাহলে, সবসময়
আপনি ক্রস বৈধতা
জন্য হাতে তথ্য একটি
অংশ থাকতে হবে।
আমরা যে মডেলটি আপনার
ডেটাতে প্রশিক্ষিত
করা উচিত এবং তা তাজা
তথ্যগুলিতে পরীক্ষা
করে তা পরীক্ষা করতে
হবে, যেমন আমরা পরীক্ষামূলক
ডেটার উপর ভিত্তি
করে একটি শ্রেণীবিন্যাসী
তৈরি করেছি বা তারপর,
আমরা শ্রেণীবদ্ধকের
পরীক্ষা করে নিই।

Gujarati: 
નથી. આ માહિતીને વધુ
સારી રીતે એકત્રિત
કરવાની જરૂર છે, જેથી
તે માહિતીપ્રદ બરાબર
કહેવાતી હોય. તેથી,
કૃપા કરીને ધ્યાનમાં
રાખો. હવે, અમે આ યોજનાકીય
પુન: પ્રાપ્તિ કરીએ
છીએ જે આપણે આ પ્રવચનની
શરૂઆતમાં જોયું છે
જે અમને માહિતી એનાલિસિસ(analysis)ની
વ્યવસ્થિત પ્રક્રિયા
શું છે તે અંગે થોડો
વિચાર આપે છે. તેથી,
ટોચ પર, અમારી પાસે
અલબત્ત, પ્રક્રિયામાંથી
બહાર આવી રહેલી માહિતી
- સારૂ, સેન્સર્સમાંથી
- અને ડેટા એનાલિસિસ(
data analysis)માં પ્રથમ પગલું
કેટલાક પ્રારંભિક
પગલાઓમાંથી પસાર
થઈ રહ્યું છે જેમાં
ત્રણ બાબતોનો સમાવેશ
થાય છે: વિઝ્યુલાઇઝેશન,
ક્વોલિટી ચેક, અને
પૂર્વ પ્રક્રિયા(visualization,
quality check, and pre-processing).
હવે, ફરી આમાં, તે
ક્રમાંકિત જરૂરી
નથી. સામાન્ય રીતે,
અમારું ડેટા કાવતરું
કરવાનું પ્રથમ પગલું
છે કારણ કે સંખ્યાઓ
તમને વધુ નથી કહેતા,
પરંતુ ચિત્રો તમને
ઘણું વધારે કહે છે
અને ભારપૂર્વક જણાવે
છે કે ખરેખર તમને
અહીં સ્લાઇડ પર લઇ
જવા દો.
અન્સકોમબે(Anscombe) ડેટા
સેટ જાણીતા પર આધારિત
આ એક ખૂબ શાસ્ત્રીય
ઉદાહરણ છે. અને આ ડેટા
સેટ પણ આર(R) માં ઉપલબ્ધ
છે, જે ઘણા ડેટા સમૂહો
છે જે જ્યારે તમે
ઇન્સ્ટોલ કરો ત્યારે
તેની સાથે આવે છે.
હવે, આ અન્સકોમબે(Anscombe)
ડેટા સેટની સુંદરતા
છે ... ચાલો હું તમને
અહીં બતાવુ છુ. મારી
પાસે ચાર ડેટા છે,
જે ચલોના જોડાની
છે. x 1 y 1, x 2 y 2, x 3 y 3 અને
x 4 y 4 નો વિચાર કરો.
તેઓ બધા દૃષ્ટિની
ખૂબ અલગ જુએ છે; તેમ
છતાં, જો તમે ડેટા
પર ધ્યાન ન રાખ્યું
હોત, અને તમે ગણતરી
કરી હતી, ઉદાહરણ તરીકે,
સરેરાશ અથવા અંતર
અથવા તમે સંબંધિત
જોડીઓ વચ્ચે એક મોડેલ
ફિટ કરો છો અથવા સહસંબંધ
પર ગણતરી કરો છો, તો
તે બધા સમાન હશે, તેઓ
બધા સમાન હશે. તેથી,
વર્ણનાત્મક આંકડા
અથવા તમારા રીગ્રેસન(regression)ને
આધારે, તમે આ ચાર ડેટા
સમૂહો વચ્ચે કોઈ
ભેદભાવ કરી શકશો
નહીં. જો કે, તમે જોઈ
શકો છો, આ દરેક ડેટાના
લક્ષણોમાં આટલા મોટા
તફાવત છે. ઉદાહરણ
તરીકે, જો તમે ડેટા
સેટ 2 જુઓ, તો ત્યાં
પરવલયના સંબંધો છે,
જ્યારે ડેટા સેટ
4, તમામ બિંદુઓ એક
સીધી રેખા પર પડે
છે. વ્યવહારીક રીતે,
x માં કોઈ ફેરફાર નથી,
ફક્ત y એક બાહ્યથી
અલગ છે. તેથી, આ ડેટા
સેટ પણ તમારા ડેટાનું
એનાલિસિસ(analysis) કરવા
માટે શું કરી શકે
છે તે દર્શાવવા માટે
ખૂબ ઉપયોગી છે. ઓઉટલીયેર
(Outliers) તે માહિતી બિંદુઓ
કે જે સામાન્ય વસ્તુમાંથી
બહાર આવે છે અથવા
તે પ્રદેશમાંથી બહાર
આવે છે જ્યાં બાકીના
ડેટા. વાસ્તવમાં,
જો તમે ડેટા સેટ 3
જુઓ તો, તમામ ડેટા
બિંદુઓ એક સીધી રેખા
પર રહે છે, સિવાય કે
એક ડેટા બિંદુ, જે
એક ઓઉટલીયેર (Outliers)
છે. તેથી, જ્યારે તમે
વર્ણનાત્મક આંકડા
એકલા જુઓ ત્યારે
બે ડેટ્સ સમૂહો સંપૂર્ણપણે
એકસરખા દેખાય છે,
જ્યારે ક્ષણ તમે
તેને કાવતરું કરો
છો, તમે જાણો છો કે
એક વિશાળ તફાવત છે
અને પછી, અલબત્ત, અમે
સુધારાત્મક કાર્યવાહી
કરીશું અને લક્ષણોને

Bengali: 
আমি আপডেট করা হয়েছে
যে ডেটা সেট সুতরাং,
ক্রস যাচাইয়ের জন্য
সবসময় সেট ডেট সেটের
অংশ রাখুন।
এবং কখনও কখনও এটি
ঐতিহাসিকদের থেকে
আসা যে তথ্য উত্থাপিত
হতে পারে পরিমাণগত
বা কম্প্রেশন ত্রুটি
মূল্যায়ন করা প্রয়োজন
হতে পারে।
এই দিনটি এত খারাপ
নাও হতে পারে, কিন্তু
যদি আপনি তথ্য সন্ধান
করেন তবে 10 বছর আগেও
হতে পারে, এবং এগুলি
আরও বেশি পরিমাণে
বা সংকুচিত হবে এবং
এটি আপনার ডেটা বিশ্লেষণের
কোর্সটি উল্লেখযোগ্যভাবে
পরিবর্তন করতে পারে।
তারা শারীরিক প্রক্রিয়া
একটি অংশ না হয় যা
অপ্রয়োজনীয় অ linearities
প্রবর্তন করতে পারে।
এটা আপনার ডেটা অর্জন
প্রক্রিয়া মাত্র
একটি অংশ।
অবশ্যই, আমরা ভিজ্যুয়ালাইজেশন
সম্পর্কে আলোচনা
করেছি যেখানে আমরা
উচ্চ মাত্রিক প্লট,
বার চার্ট এবং এর
মতো সহজ প্রবণতা
দেখি।
তালিকাটি মোটামুটি
সুবিন্যস্ত নয়,
তবে বিশ্লেষণের আগে,
পরে, এবং পরে সংখ্যাগুলি
সচিত্র উপস্থাপনার
রূপান্তর করে।
সুতরাং ভিজ্যুয়ালাইজেশন
একটি অংশ - অবিচ্ছিন্ন
অংশ - তথ্য বিশ্লেষণের
প্রতিটি পর্যায়ে।
সুতরাং, আমরা Enscombe
ডেটা সেট সম্পর্কে
কথা বলেছি যা মূলত
ভিজ্যুয়ালাইজেশনের
জন্য জোর দেয়।
বিশ্লেষণের মূল পদক্ষেপগুলি
আমরা যা আলোচনা করব
এবং তারপর বক্তৃতা
শেষ করব।
বিশ্লেষণের ডোমেন
নির্বাচন করুন আমরা
এখানে ডোমেন দ্বারা
বোঝাচ্ছি যে আমরা
একই ডোমেনের যে তথ্য
পেয়েছি তা বিশ্লেষণ
করতে চাই।
সাধারণত সময় একটি
ডোমেন নির্ভর ডোমেন
- আমরা তথ্য সংগ্রহ
করি, কিন্তু আমরা
সময় ডোমেনের ডেটা
বিশ্লেষণ করতে চাই
না।
কখনও কখনও আমরা ফ্রিকোয়েন্সি
ডোমেন থেকে স্থানান্তর
করতে চাইতে পারেন।
আসলে, এটি একটি খুব
সাধারণ পদ্ধতি যা
পর্যায়কালীন আবিষ্কারক
অনুসরণ করে।
যদি আপনি বায়ুমণ্ডলীয়
তথ্য বা এমনকি কম্পন
যন্ত্র থেকে আসা
ডেটা, ইসিজি বা ইইজি
তথ্য দেখেন, যেমন
সমস্ত তথ্য, ফ্রিকোয়েন্সি
ডোমেন বিশ্লেষণ বিশ্লেষণের
একটি অত্যন্ত সুবিধাজনক
ডোমেইন কারণ এটি
বৈশিষ্ট্যগুলি প্রকাশ
করে যা সরাসরি শারীরিক
বৈশিষ্ট্যগুলির
সাথে সম্পর্কিত হতে
পারে প্রক্রিয়া।
এবং অবশ্যই, অনেকবার
আপনি যুগ্ম সময়
ফ্রিকোয়েন্সি বিশ্লেষণ
করতে হবে।
ওয়েভলেট তাদের মধ্যে
একটি।
সুতরাং, বিশ্লেষণ
ডোমেন নির্বাচন করুন
এবং সময় প্রয়োজন
না, এটি স্থান হতে
পারে।
অনেক সময় তথ্য আপনার
কাছে ফ্রিকোয়েন্সি
অবিলম্বে ফাংশন হিসাবে
আসতে পারে, যেমন পর্যবেক্ষণ
স্পেকট্রোস্কোপি
ডেটা ক্রোমাটোগ্রাফি
থেকে ফ্রিকোয়েন্সি
একটি ফাংশন হিসাবে
আসে।

Gujarati: 
યોગ્ય રીતે બહાર
કાઢવા માટે જરૂરી
પગલાં લઈશું.
તેથી, તે આશા છે કે
તે કોઈ પણ માહિતી
એનાલિસિસ(analysis) પહેલાં
ડેટાને પ્રકાશિત
કરવાની જરૂરિયાતને
હોમ કરે છે. અને પછી,
અલબત્ત, અમે માત્ર
એક ગુણવત્તા તપાસ
કરી હતી. ઉદાહરણ તરીકે,
અમે ઓઉટલીયેર (Outliers)ની
હાજરીને જોયું છે.
તે ખૂબ મહત્વનું
છે. ઘણીવાર માહિતી
ગુમ કિંમતો સાથે
આવે છે ગુમ કિંમતો
સાથે કેવી રીતે કામ
કરવું તે તમારે નક્કી
કરવું પડશે. ત્યાં
સંપૂર્ણ સિદ્ધાંત
ઉપલબ્ધ છે કે શું
તમારે તેને બદલવું
જોઈએ અથવા તેની સાથે
રહેવું જોઈએ, આંતરછેદ
કરવું, અને તેથી વધુ.
તેથી દેખીતી રીતે,
અહીં તે વિશે વાત
કરવી શક્ય નથી. અને
તે પછી, અન્ય પ્રકારના
પૂર્વ પ્રક્રિયા
કે જે તમારે કરવું
પડશે. ઉદાહરણ તરીકે,
તમારે મલ્ટિવેરિયેબલ
પ્રોસેસમાં ટાઇમ
સ્ટેમ્પ્સ(time stamp) ને
સમન્વયન કરવાનું
રહેશે; જ્યાં તમે
વિવિધ વેરિયેબલ્સમાંથી
ડેટા એકત્રિત કરો
છો, તમારે સમયની ટિકિટોને
સમન્વયન કરવી પડે
છે અથવા ક્યારેક
એક વેરિયેબલ એક નમૂના
દર પર એકત્રિત કરવામાં
આવે છે, અન્ય વેરિયેબલ
એક બીજા નમૂના દરે
એકત્રિત કરવામાં
આવે છે, પછી તમારે
તે કેવી રીતે પૂર્વ
પ્રક્રિયા કરવી તે
નક્કી કરવું પડશે.
ક્યારેક, વાસ્તવમાં,
ઘણી બધી માહિતીનો
અવાજ ઘોંઘાટ સાથે
આવે છે અને આપણે કોઈ
અન્ય પગલા પહેલાં
અવાજને દૂર કરવો
પડે છે કે જે તમે એનાલિસિસ(analysis)
તરીકે લઈ શકો છો, કારણ
કે અવાજ ખરેખર એવા
છે કે જે આપણે ડ્રો
કરીએ છીએ. તે ડેટા
એનાલિસિસ( data analysis)ના
કોર્સને નોંધપાત્ર
રીતે અસર કરી શકે
છે. તેથી, આપણે અવાજને
ફિલ્ટર કરવા માગીએ
છીએ. તેથી, ઘણા બધા
કારણો છે કે તમે આ
પ્રારંભિક પગલામાં
સમય પસાર કરવા માંગતા
હો કે જે કદાચ સૌથી
મહત્વપૂર્ણ છે. કેટલાક
બીટ ... તેમાં કડવી
કવાયત છે. તે તમારા
ચેતાને ખરેખર મેળવી
શકે છે અને સોનેરી
80/20 નિયમ છે જે 100 ટકા
જેટલો સમય કહે છે
કે તે એકંદરે ડેટા
એનાલિસિસ( data analysis) માટે
લે છે, તમારે 80 ટકા
સમયનો ડેટા પૂર્વ
પ્રક્રિયાનો ઉપયોગ
કરવો પડશે. . આ પ્રકારનો
પ્રયત્ન છે કે તમારે
કેટલીક વખત મુકવો
પડશે. જો તમે નસીબદાર
છો, અલબત્ત, તમે માત્ર
એક ગોઠવણમાં આ પગલું
દ્વારા પસાર કરી
શકો છો. પછી આવે છે,
અલબત્ત, તમારા એનાલિસિસ(analysis)નો
મુખ્ય ભાગ જે મોડેલિંગ
અથવા અંદાજ અથવા
શોધક છે અથવા સંભવિત
રૂપે પ્રકારની અથવા
સૂચિત પ્રકારની એનાલિસિસ(analysis)નું
નિદાન અને તેથી વધુ
પરિણામો જેવા કે
મોનિટરિંગ, નિયંત્રણ,
ઑપ્ટિમાઇઝેશન(optimization)
, નવીનતાઓ જેમ આપણે
અગાઉ ચર્ચા કરી છે.
હવે, ખૂબ જ મહત્વપૂર્ણ
છે, આ બધા પગલાંઓમાં,
તમારે બે બાબતો ધ્યાનમાં
રાખવી જોઈએ. એક તીર
સૂચવે છે તે પ્રમાણે,
તે આવશ્યકપણે પુનરાવર્તન
નથી. એનો અર્થ એ કે,
ક્યારેક તમને પાછા
જવું પડશે. તેથી, જો
મને લાગે કે ડેટા
ગુણવત્તા નબળી છે,
તો મને મારા પ્રયોગ
પર પાછા જવું પડશે

Gujarati: 
અથવા જે વ્યક્તિ
મને વધુ સારી માહિતી
આપવા માટેનો ડેટા
આપે છે અથવા મને લાગે
છે કે જે સુવિધાઓ
હું ઇચ્છું છું તે
ડેટામાં હાજર નથી
, મને પ્રયોગ ફરી શરૂ
કરવો પડે છે અથવા
અંદાજ પછી હું જાણું
છું કે ડેટા ગુણવત્તા
પૂરતી સારી નથી અથવા
મેં પૂરતી પૂર્વ
પ્રક્રિયાની કામગીરી
કરી ન હતી, મને પાછા
જવું પડશે અને તેથી
વધુ. તે પ્રથમ બિંદુ
છે અને બીજો મુદ્દો
એ છે કે તમારી પાસે
કોઈ ડોમેન જ્ઞાન
છે, અને તે ખૂબ જ મહત્વપૂર્ણ
છે; દેખીતી રીતે, તમારે
માહિતી ક્યાંથી આવે
છે તે જાણવું જોઈએ,
પછી ભલે તે એક જૈવિક
પ્રક્રિયાની, આર્થિક
અર્થતંત્ર પ્રક્રિયા
અથવા એન્જીનિયરિંગ
પ્રક્રિયા અથવા કેટલીક
સોશિયલ મીડિયા પ્રોસેસથી
આવતી હોય અથવા તો
... અથવા રાસાયણિક
પ્રક્રિયાનો અને
તેથી આગળ. તમારા ડેટા
માટે નમૂનાનો દર
શું હોવો જોઈએ તે
પસંદ કરવામાં પણ
તે જ્ઞાન પ્રત્યેક
પગલામાં માનવું જોઈએ
- તે કેટલી વાર તમે
ડેટા એકત્રિત કરવો
જોઈએ; તે જ્યાં ડોમેન
જ્ઞાનની તમારી સફર
શરૂ થાય છે. અને જો
હું જાણું છું, ઉદાહરણ
તરીકે, હું પીએચ સિસ્ટમ
જોઈ રહ્યો છું, મને
ખબર છે કે તે એક નોન-રેખીય
સિસ્ટમ છે. પછી જ્યારે
મોડેલિંગ તબક્કે,
મને રેખીય મોડેલો
બનાવવાનું પણ વિચારવું
ન જોઈએ, પરંતુ જો મને
ખબર નથી કે ડેટા ક્યાંથી
આવે છે, તે માત્ર એક
ડેટા સેટ અને તેના
મર્યાદિત ઉપયોગમાં
રહે છે, તેની માત્ર
અમુક પ્રકારની એક
રમકડા જે હું આસપાસ
રમી રહ્યો છું. તેથી,
ડોમેઈન(domain) જ્ઞાનનો
ઉપયોગ દરેક તબક્કે
શ્રેષ્ઠ શક્ય રીતે
થવો જોઈએ અને તે ચોક્કસ
રીતે, કેટલી ડોમેઈન(domain)
જ્ઞાન છે તેની પર
આધાર રાખે છે. તે મોડેલનું
માળખું પસંદ કરવામાં
તમને મદદ કરી શકે
છે, તમે કયા પ્રકારનાં
લક્ષણો શોધી શકો
છો અથવા અવાજની તે
સ્તર કે જે તમે અપેક્ષા
રાખી શકો છો - ભલે
તે સેન્સર(sensor)નો અવાજ
અથવા પ્રક્રિયાનો
અવાજ અને તેથી વધુ,
અથવા તમારા એપ્લિકેશન્સમાં
પણ . તેથી, તે ધ્યાનમાં
રાખવી જોઈએ. બધા ઈન
પ્રક્રીયામાં બધા
પુનરાવર્તન, પરંતુ
તે એક ચોક્કસ પ્રક્રિયા
છે - તમારા મોડેલ યોગ્ય
રીતે પસંદ કરો અને
ખાતરી કરો કે તમે
માહિતી ગુણવત્તા
તપાસ મારફતે જાઓ;
માહિતી વિઝ્યુઅલાઈઝ;
પૂર્વ પ્રક્રિયા;
પછી તમારા નમૂનાઓને
યોગ્ય રીતે પસંદ
કરો, જો તમે મૉડલોનું
નિર્માણ કરી રહ્યા
છો અને તેથી વધુ. અમે
તે વિશે મોડેલિંગ
કુશળતા અથવા અંદાજો
પરના આગામી વ્યાખ્યાનમાં
તે વિશે વાત કરીશું.
તેથી, હવે આપણે તેના
પર થોડી વધુ વિસ્તૃત
કરીશું.
તેથી, આપણે ડેટા એનાલિસિસ(
data analysis) તરફ આગળ વધતા
પહેલાં, પ્રથમ પગલા,
જેમ આપણે શીખ્યા
તેમ, કેટલાક પ્રારંભિક
પ્રશ્નો પૂછવું છે.
કયા પ્રકારની એનાલિસિસ(analysis)
જરૂરી છે?
તે વર્ણનાત્મક, આગાહીયુક્ત
છે અને તેથી વધુ છે,
કારણ કે તે એનાલિસિસ(analysis)ના
સમગ્ર અભ્યાસમાં
ફેરફાર કરે છે. ડેટા
ક્યાંથી આવે છે?
ડેટાના સ્ત્રોતો
- અમે હમણાં જ પૂછ્યું

Bengali: 
তারপর দ্বিতীয় একটি
যা আমাদের সিদ্ধান্ত
গ্রহণ করতে হতে পারে
dimentionality হ্রাস এবং বিশেষ
করে যখন আমরা বড়
মাত্রিক তথ্য দেখছি
এই এখন ক্রমবর্ধমান
সাধারণ হয়ে উঠছে।
বৃহত্তর মাত্রায়
মাল্টিভিওরেবল ডেটা
বিশ্লেষণ করা সম্ভব
নয়, বিশেষ করে যখন
এটি শত শত এবং হাজার
হাজার বছর ধরে চলতে
থাকে, এবং আজকের দিনগুলিতে
এটি খুবই সাধারণ।
এবং মেশিন লার্নিং
আলগোরিদিম এই বিষয়ে
খুব সহজে আসে।
প্রিন্সিপাল উপাদান
বিশ্লেষণ, অ নেগেটিভ
ম্যাট্রিক্স factorization,
এবং অন্যান্য অনেক
মাত্রিক হ্রাস কৌশল
বড় মাত্রায় তথ্য,
বড় মাত্রিক তথ্য
বিশ্লেষণে খুব শক্তিশালী।
সুতরাং, আমরা একটি
সিদ্ধান্ত গ্রহণ
করতে হবে কি না এমন
পরিমাপের বিশ্লেষণ
করা উচিত যা আমি অর্জন
করেছি বা হ্রাসকরণে
বা নিম্ন আদেশ মাত্রা।
এবং সবচেয়ে গুরুত্বপূর্ণ
একটি সঠিক গাণিতিক
বা পরিসংখ্যান টুল
নির্বাচন করা হয়।
উদাহরণস্বরূপ, যদি
আমি গড় অনুমান করতে
চাই, তাহলে আমি একজন
গড়ক হিসাবে নমুনা
গড় বা নমুনা মধ্যমা
চয়ন করতে পারি।
এখন, যখন আমি একটি
অনুমানকারী হিসাবে
নমুনা গড় চয়ন করা
উচিত, যখন আমি নমুনা
মধ্যমা নির্বাচন
করা উচিত - এটি জন্য
কোন নিখুঁত উত্তর
আছে, কিন্তু কিছু
খুব ভাল নির্দেশিকা
আছে।
যদি আমি জানি যে ডাটা
আউটলাইয়ারগুলি
বিনামূল্যে এবং এটি
একটি গাউসিয়ান বিতরণ
প্রক্রিয়া থেকে
বেরিয়ে আসছে, নমুনা
মানে আপনাকে সবচেয়ে
কার্যকর অনুমান প্রদান
করে - অর্থাত সর্বোপরি
সর্বনিম্ন সম্ভাব্য
ত্রুটির অনুমান;
কিন্তু যদি আমি লক্ষ্য
করি যে তথ্য outliers সঙ্গে
সংশোধন করা যেতে
পারে এবং আমি আমার
অনুমানকারী এটি দ্বারা
প্রভাবিত করতে চান
না, তারপর নমুনা মানে
শক্তসমর্থ নয় এটা
খুব সংবেদনশীল outliers
মানে, তারপর আমি নমুনা
মধ্যমা ব্যবহার করা
উচিত।
এটি পূর্ব জ্ঞান
এবং আমার প্রাথমিক
তথ্য বিশ্লেষণের
ধাপ থেকে আমি যে জ্ঞান
পেয়েছি তা নির্ভর
করে।
এবং এই ধরনের সিদ্ধান্ত
প্রতিটি পর্যায়ে
তৈরি করা হবে এবং
অনন্য উত্তর হতে
পারে না।
মনে রাখবেন, যে; তথ্য
বিশ্লেষণে, আপনার
বিশ্লেষণের প্রতিটি
পর্যায়ে এবং এমনকি
এমনকি শেষ পর্যন্ত
কোন অনন্য উত্তর
নেই, এমনকি যখন আপনি
একটি মডেল তৈরি করেন,
তখন এমন অনেক মডেল
থাকতে পারে যা প্রদত্ত
তথ্য ব্যাখ্যা করতে
পারে এবং আপনাকে
আসলে মডেল ভিত্তিক
নির্বাচন করতে হতে
পারে কিছু মানদণ্ড
উপর।
এবং অনুরূপভাবে,
হাইপোথিসিস পরীক্ষা,
আমরা একটি উপযুক্ত
পরিসংখ্যান নির্বাচন
এবং বিভাজন বিশ্লেষণ
আছে।
আমাদের প্রথম জানতে
হবে পরিবর্তনশীলতার
উত্স কি তা; অন্তত
যথোপযুক্তভাবে যথেষ্ট
বা মডেলিং হিসাবে
অনুমান হিসাবে আমি

Gujarati: 
છે, અમારી પાસે ટાઇમે
ડોમેન(time domain), ડેટા
ફ્રિકવન્સી ડોમેન(data
frequency domain), ડેટા બાયોલોજિકલ
પ્રોસેસ(data biological process)
ડેટા અને તેથી વધુ
છે. ડેટા કેવી રીતે
પ્રાપ્ત થયો?
કયા પ્રકારના હાર્ડવેરનો
ઉપયોગ થયો હતો?
શું તે માનવીએ માહિતી
એકત્રિત કરી હતી?
તે સેન્સર(sensor) હતું?
જો તે સેન્સર(sensor) હતું,
તો નમૂનાનો દર શું
હતો?
તેથી ઘણા સવાલો આપણે
જાણી શકીએ કે અમારા
માટે એનાલિસિસ(analysis)ની
ગુણવત્તા કેટલી સારી
છે તે હું કહી શકું
છું, અને કયા પ્રકારની
એનાલિસિસ(analysis) સાધનોનો
ઉપયોગ કરવો જોઈએ,
અને મારે શું શોધવું
જોઈએ. અને પછી, અલબત્ત,
કેટલું માહિતીપ્રદ
છે - તે થોડુંક ગુણાત્મક
છે, પરંતુ માહિતીના
ચોક્કસ જથ્થાત્મક
પગલાં પણ છે. અમે તેના
વિશે વાત નહીં કરીએ,
પરંતુ મેં કહ્યું
તેમ, તે મૂળભૂત રીતે
ગુણવત્તાયુક્ત તપાસ
સાથે સંકળાયેલી છે
કે શું ડેટા ઓઉટલીયેર
(Outliers) ખૂટે છે અને તેથી
વધુ. અને છેલ્લે, પણ
કદાચ સૌથી મહત્વપૂર્ણ
- ડેટા જનરેટિંગ(data
generating) પ્રક્રિયા પર
ધારણા કરવામાં આવી
રહી છે તે સ્પષ્ટ
હોવું જોઈએ. તમે ખોટી
હોઈ શકો છો શરૂઆતમાં,
આપણે ખોટી ધારણાઓ
કરી શકીએ છીએ, આપણે
નક્કી કરવા માટે
સ્ટોકેસ્ટિક(stochastic)
પ્રક્રિયાને ધારણ
કરી શકીએ છીએ, અમે
રેખીય બનવા માટે
બિન-રેખીય પ્રક્રિયા
ધારણ કરી શકીએ છીએ,
ગતિશીલ અને સ્થિર
સ્થિતિની સ્થિર સ્થિતિની
પ્રક્રિયા કરી શકીએ
છીએ; તે શક્ય છે. પરંતુ
આપણે ડેટા એનાલિસિસ(
data analysis)માં જે ધારણાઓ
કરી છે તે વળગી રહેવું
જોઈએ, અને પસંદ કરવું
અને સતત અને અનુકૂળ
હોવું જોઈએ - એટલે
આપણે યોગ્ય સાધનો
પસંદ કરવો જોઈએ અને
તેથી, જો તમે કોઈ ભૂલ
કરી હોય તો, અંતે,
અમે ખબર નથી કે અમે
ભૂલ કરી છે. અને પછી,
અમે પાછા જઇએ છીએ,
અને સુધારા કરો. અને
હું ખરેખર આ વિગતમાં
જતો નથી. અમે પહેલાથી
જ તેના વિશે વાત કરી
છે. તેથી, એકવાર તમે
પ્રારંભિક પ્રશ્નો
દ્વારા જઇ રહ્યા
છો, અમે ઘણા ડેટા પૂર્વ
પ્રક્રિયા પગલાં
દ્વારા, અમારા ડેટાને
તૈયાર કરીએ છીએ; ડેટા
કયા પ્રકારની સમસ્યા
છે તેના પર આધાર રાખે
છે.
ઉદાહરણ તરીકે, જો
ડેટા આઉટલેઅર્સ(Outliers)
છે, તો મારો અર્થ છે,
મને સાફ કરવું પડશે,
પણ મજબૂત પદ્ધતિઓ
પણ છે અમે કહીએ છીએ
કે આઉટલેઅર્સ(Outliers)
ડેટામાં રહે છે અને
હજુ પણ તમને યોગ્ય
અંદાજો અને તેથી
આગળ વધવા દો છે, અથવા
અમારે ફિલ્ટર કરવું
પડશે. એક વસ્તુ જે
મેં પહેલા ઉલ્લેખ
નથી કર્યો તે માહિતીનું
વિભાજન કરી રહ્યું
છે. જો તમે કોઈ મોડેલ
બનાવતા હોવ અથવા
જો તમે લક્ષણો અને
અન્ય સુવિધાઓનો ઉપયોગ
કરીને વર્ગીકરણ કરી
રહ્યા હો, તો હંમેશાં
તમારી પાસે ક્રોસ
માન્યતા માટેના ડેટાનો
એક ભાગ હોવો જોઈએ.
અમે આ મોડેલને લઈએ
છીએ કે જે તમે ડેટા
પર તાલીમ પામેલ છે
અને તે તાજા ડેટા
પર પરીક્ષણ કર્યું
છે જે સમાન પ્રાયોગિક
પરિસ્થિતિઓમાંથી

Bengali: 
আপনাকে সঠিক regressor
সেট এবং মডেল কাঠামো
নির্বাচন করতে হবে
এবং তাই, এবং পূর্বে
এবং/অথবা ডোমেন জ্ঞান
সবসময় ফ্যাক্টর।
আপনি একটি অগ্রাধিকার
কিছু জানতে পারেন,
অগত্যা পদার্থবিজ্ঞান
বা প্রক্রিয়া সম্পর্কিত
না, কিন্তু হতে পারে
সেন্সর বৈশিষ্ট্য
থেকে এবং তাই, এবং
অবশ্যই, আপনি ডোমেন
বা পদার্থবিজ্ঞান
বা রসায়ন বা জীববিদ্যা
সম্পর্কে কিছু জানতে
পারেন প্রক্রিয়া
যে আপনি সহজেই ফ্যাক্টর
এবং অনেকটা মাথাব্যাথা
সংরক্ষণ করতে পারেন।
এবং অবশেষে, একবার
আপনার সমস্ত বিশ্লেষণের
সাথে সম্পন্ন হয়ে
গেলে, এটি সবচেয়ে
গুরুত্বপূর্ণ অংশ
- আপনি কতগুলি ফলাফল
পেয়েছেন এবং তাদের
প্রতিবেদন করছেন
তা নির্ণয় করা খুবই
গুরুত্বপূর্ণ
পদক্ষেপ।
সর্বদা একটি প্যারামিটার
বিষয়, একটি অনুমান
পরীক্ষা অনুমান - কিনা
এটা যথেষ্ট উল্লেখযোগ্য,
আপনি সম্ভবত সুযোগ
দ্বারা একটি অ শূন্য
মান অর্জন করেছেন
কিনা, কিনা সত্যিই
আপনি শূন্য অর্জন
করা উচিত সুতরাং,
আপনি প্যারামিটার
হল অনুমান পরীক্ষা
করা উচিত শূন্য - যে
নল অনুমান, এবং তারপর,
একটি পরিসংখ্যানগত
শব্দ পদ্ধতিতে বহন।
এবং দ্বিতীয়ত, অনুমান
অঞ্চলে এবং ত্রুটিগুলি
রিপোর্ট করুন।
আসলে, আত্মবিশ্বাসের
ক্ষেত্রগুলি গণনা
এবং ত্রুটিগুলি আপনার
হাইপোথিসিস টেস্টের
অবিচ্ছেদ্য অংশ।
এবং তারপর, আপনি মডেল
নির্মাণ করা হয়,
তারপর মডেল বৈধ ক্রস।
আমি এখানে মডেল বলতে
যখন, রিগ্রেশন মডেল
না প্রয়োজন, এটি
ক্লাসিফায়ার এছাড়াও
হতে পারে।
এবং একাধিক মডেল
সনাক্ত করা হলে, মানদণ্ডের
মিশ্রণ ব্যবহার করুন;
আমাদের যেমন আগে
উল্লেখ করা হয়েছে,
অনন্য উত্তর হতে
পারে না; সাধারণত,
যে ক্ষেত্রে হয়।
আমার ছাত্ররা সবসময়
আমাকে জিজ্ঞেস করে,
ভাল, আমি দুই বা তিনটি
মডেল ডেটা ব্যাখ্যা
করছি, যা আমি বেছে
নেব?
ভাল, প্রথম জিনিসটি
নিশ্চিত করার জন্য
যে আপনি আপনার সমাধানগুলির
সংখ্যা কমিয়ে আনার
জন্য এবং খুব ভাল
প্রচেষ্টা সত্ত্বেও
আপনি একাধিক সমাধান
দিয়ে খুব কমই সমাধান
করতে পারেন একটি
খুব নিয়মানুগ পদ্ধতি
অনুসরণ করে থাকেন।
তারপর আপনি কি তথ্য
কি হিসাবে তথ্য হিসাবে
পরিচিত করা হয় Aikeike
তথ্য মানদণ্ড বা
Bayesinformation মানদণ্ড হিসাবে
প্রয়োগ।
এবং মডেলের শেষ ব্যবহারও
রাখুন; আপনার মডেল
অনলাইন প্রয়োগ করা
যেতে পারে; তাই, ভবিষ্যতের
ভবিষ্যতের ভবিষ্যৎবাণীতে
কিছুটা আত্মবিশ্বাসের
সাথে সহজ মডেলের
মতো সহজ মডেলটি পছন্দ
করা হয়।
সুতরাং, আবার কোন
অনন্য উত্তর আছে,
কিন্তু শেষ পর্যন্ত,
আপনি রিপোর্ট চূড়ান্ত
ফলাফল দুটি জিনিস
থাকা উচিত: এটি একটি
পরিসংখ্যান ব্যাকিং
এবং আপনি এই ফলাফল

Bengali: 
রিপোর্ট করার সিদ্ধান্ত
নিয়েছে কেন এবং
একটি শব্দ যুক্তি
কারণ ফলাফল হয় উপায়
তারা হয়।
সুতরাং, সুতরাং, আপনি
মনে রাখবেন ডাটা
বিশ্লেষণ শুধুমাত্র
বিজ্ঞান একা নয়।
হ্যাঁ, এটি একটি বড়
অংশ বিজ্ঞান, কিন্তু
এর একটি গুরুত্বপূর্ণ
অংশ একটি শিল্পও।
অতএব, তথ্য বিশ্লেষণ
হচ্ছে, একটি বিজ্ঞান
এবং একটি শিল্প উভয়।
আত্মবিশ্বাসের ক্ষেত্র
এবং ত্রুটিগুলি প্রতিবেদন
না করে এবং প্রতিবেদনগুলি
প্রতিবেদন নাও করা;
যতটা সম্ভব, আপনি
অবশ্যই তা করতে হবে।
অবশ্যই, খুব জটিল
পরামিতি অনুমান সমস্যার
মধ্যে, আত্মবিশ্বাসের
ক্ষেত্রগুলি অর্জন
করা খুব কঠিন হতে
পারে তবে ত্রুটিগুলি
এবং আস্থা অন্তরগুলির
প্রতিবেদন করার জন্য
আপনার প্রচেষ্টার
সেরাটি প্রয়োগ করার
চেষ্টা করুন।
এই কিছু রেফারেন্সগুলি।
অবশ্যই, কোন উপায়
এটি সম্পূর্ণ না।
আমি এই বই থেকে উদাহরণ
এবং কিছু উপাদান
কিছু গ্রহণ করেছেন;
এই বেশ সাধারণ বই
যা আপনি রেন্ডম ডেটা
বিশ্লেষণ উপর প্রথম
বই পেতে পারেন খুব,
খুব দরকারী আপনার
কারণ এটি ৩০-৪০ বছর
ধরে অনুশীলন করেছেন
যারা বিভিন্ন ধরনের
তথ্য দেখা যায়, এবং
তাদের উদাহরণ আছে,
তাদের পাঠ্য বইগুলিতে
খুব ভাল উদাহরণ।
এবং অবশিষ্ট তিনটি,
জনসন এবং মন্টগোমারি
এবং রঙ্গেরের অন্ততপক্ষে
বই, তারা সম্ভবত ক্লাসিকাল
বইগুলি সম্ভাব্যতা
এবং পরিসংখ্যান - প্রয়োগযোগ্যতা
এবং পরিসংখ্যান প্রয়োগ
করে।
ওগুননাইচের বইটি
আপনাকে ইঞ্জিনিয়ারদের
জন্য সম্ভাব্যতা
এবং পরিসংখ্যানের
মৌলিক বিষয়গুলি
প্রদান করে।
আপনি যদি একজন প্রকৌশলী
হন, তবে আপনি বইটি
দেখতে আগ্রহী হতে
পারেন।
অবশ্যই, আপনি আরও
উল্লেখ করতে পারেন
যে অন্যান্য শত বই
আছে।
তাই আশা করছি আপনি
বক্তৃতা উপভোগ করেছেন
এবং আপনি কমপক্ষে
তথ্য বিশ্লেষণ কি
সব সম্পর্কে, আপনি
কি গ্রহণ করা হয়
সতর্কতা অবলম্বন
করা পদক্ষেপ, এবং
আপনি তথ্য বিশ্লেষণ
হতে হবে কিভাবে সতর্কতা,
পদ্ধতিগত পদ্ধতি
কি, এবং কিছু পরিভাষা
আমরা দ্রুত R এর কয়েকটি
দৃষ্টান্তমূলক উদাহরণ
দেখব এবং আশা করব
যে এই বক্তৃতাটি
সম্পূরক।
ধন্যবাদ।

Gujarati: 
બહાર આવી છે, અથવા
જો આપણે ટ્રેઇનીંગ
ડેટા(training data)ના આધારે
ક્લાસિફાયર(classifier)
બનાવ્યું હોય, તો
પછી આપણે ક્લાસિફાયર(classifier)ની
ભાગ પર પરીક્ષણ કરવું
જોઈએ હું અપડેટ કરેલ
ડેટા સેટ કર્યો છે
તેથી, હંમેશા ક્રોસ
માન્યતા માટે સેટ
ડેટાનો ભાગ રાખો.
અને કેટલીક વખત તે
મૂલ્યાંકન અથવા કમ્પ્રેશનની
ભૂલોનું મૂલ્યાંકન
કરવા માટે જરૂરી
હોઇ શકે છે જે ઇતિહાસકારો
દ્વારા આવતી માહિતીમાં
જન્મે છે. આ દિવસ તે
ખૂબ ખરાબ ન પણ હોઈ
શકે, પરંતુ જો તમે
ડેટા જોઈ રહ્યા હો
તો દસ વર્ષ પહેલાં
હોઈ શકે છે, અને એટલું
જ નહીં, તે અત્યંત
પરિમાણિત અથવા સંકુચિત
હોય છે, અને તે તમારા
ડેટા એનાલિસિસ( data
analysis)નો અભ્યાસક્રમ
નોંધપાત્ર રીતે બદલી
શકે છે. તેઓ બિનજરૂરી
બિન-રેખીયતાઓ રજૂ
કરી શકે છે જે ભૌતિક
પ્રક્રિયાના ભાગ
નથી. તે ફક્ત તમારી
ડેટા એક્વિઝિશન(data
acquisition) પ્રક્રિયાનો
એક ભાગ છે.
અને અલબત્ત, અમે દ્રશ્યની
વાત કરી છે કે જ્યાં
આપણે સરળ વલણને ઉચ્ચ
પરિમાણીય પ્લોટ્સ,
પટ્ટી ચાર્ટ્સ અને
તેથી આગળ જોઈ શકીએ
છીએ. આ સૂચિ સ્પષ્ટપણે
વિસ્તૃત નથી, પરંતુ
એનાલિસિસ(analysis)ના પહેલા,
દરમિયાન અને પછી,
નંબરોને હંમેશા સચિત્ર
રીતે રજૂ કરે છે. તેથી
વિઝ્યુલાઇઝેશન(visulization)
એ એક ભાગ - અભિન્ન
ભાગ છે - ડેટા એનાલિસિસ(
data analysis)ના દરેક તબક્કે.
તેથી, અમે અન્સકોમબે(Anscombe)
ડેટા સમૂહો વિશે
વાત કરી છે જે મૂળભૂત
રીતે દ્રશ્યની જરૂરિયાત
પર ભાર મૂકે છે.
એનાલિસિસ(analysis)નું
મુખ્ય પગલું છે જે
આપણે વિશે વાત કરીશું
અને પછી લેક્ચર સમાપ્ત
કરીશું.
એનાલિસિસ(analysis)નું
ડોમેઈન પસંદ કરો
ડોમેઇન દ્વારા આપણે
જે અર્થ કરીએ છીએ
તે એ છે કે શું આપણે
તે જ ડોમેનમાંના
ડેટાનું એનાલિસિસ(analysis)
કરવા માંગીએ છીએ
જે તેને પ્રાપ્ત
કરવામાં આવ્યું છે.
સામાન્ય રીતે સમય
એ ડોમેન-સ્વતંત્ર
ડોમેન છે - જેમાં અમે
ડેટા એકત્રિત કરીએ
છીએ, પરંતુ અમે સમય
ડોમેનમાં ડેટાનું
એનાલિસિસ(analysis) કરવા
માંગતા નથી. ક્યારેક
અમે આવર્તન ડોમેન
પર ખસેડી શકો છો. હકીકતમાં,
તે એક ખૂબ જ સામાન્ય
પ્રક્રિયા છે જે
સામયિક ડિટેક્ટરમાં
અનુસરવામાં આવે છે.
જો તમે વાતાવરણીય
ડેટા અથવા સ્પંદન
મશીનરી, ઇસીજી અથવા
ઇઇજી ડેટાથી આવતા
તમામ ડેટા માટે જુઓ
છો, તો ફ્રિક્વન્સી
ડોમેન(frequency domain) એનાલિસિસ(analysis)
એ એનાલિસિસ(analysis)નું
ખૂબ અનુકૂળ ડોમેન
છે કારણ કે તે દર્શાવે
છે કે તે લક્ષણોની
સીધી રીતે સંબંધિત
ભૌતિક લાક્ષણિકતાઓ
સાથે સંબંધિત છે.
પ્રક્રિયા અને અલબત્ત,
ઘણી વખત તમારે સંયુક્ત
સમય આવર્તન એનાલિસિસ(analysis)
કરવું પડશે. વેવલેટ(Wavelets)
તેમાંથી એક છે. તેથી
એનાલિસિસ(analysis)નું
ક્ષેત્ર પસંદ કરો
અને સમયની જરૂર નથી,
તે જગ્યા પર પણ હોઈ
શકે છે. ઘણી વખત માહિતી
આવશ્યકપણે ફ્રીક્વન્સીના
કાર્ય તરીકે તમારી
પાસે આવી શકે છે, જેમ
કે નિરીક્ષણ સ્પેક્ટ્રોસ્કોપી(spectroscopy)
ડેટા ક્રોમેટોગ્રાફ(chromatograph)થી
આવર્તનના કાર્ય તરીકે

Gujarati: 
આવે છે. પછી બીજી કોઈ
વ્યક્તિ કે જેના
પર અમારે નિર્ણય
લેવો તે ડિમેંશનાલિટી
રિડયુકશન(dimentionality reduction)અને
ખાસ કરીને જ્યારે
આપણે મોટા પરિમાણીય
ડેટા જોઈ રહ્યા હોય
ત્યારે.
આ હવે વધુ સામાન્ય
બની રહ્યું છે. મોટા
કદમાં મલ્ટિવેરિયેબલ
ડેટાનું એનાલિસિસ(analysis)
કરવાનું શક્ય નથી,
ખાસ કરીને જ્યારે
તે સેંકડો અને હજ્જારો
અને તેથી આગળ જાય
છે અને આજે પણ તે ખૂબ
જ સામાન્ય છે. અને
મશીન શિક્ષણ ગાણિતીક
નિયમો આ સંદર્ભમાં
ખૂબ જ સરળ છે. મુખ્ય
કમ્પોનન્ટ એનાલિસિસ(analysis),
બિન-નકારાત્મક મેટ્રિક્સ
પરિબળ, અને ઘણાં અન્ય
પરિમાણીય ઘટાડાની
તકનીકો મોટા કદનાતાના
ડેટા, મોટા પરિમાણીય
ડેટાનું એનાલિસિસ(analysis)
કરવામાં ખૂબ શક્તિશાળી
છે. તેથી, અમારે નિર્ણય
લેવો પડશે કે નહીં
તે પરિમાણોમાં એનાલિસિસ(analysis)
કરવું કે જેમાં મેં
મેળવી છે અથવા ઘટાડો
ક્રમમાં અથવા નીચલા
ક્રમમાં પરિમાણ.
અને સૌથી મહત્ત્વની
એ છે કે એક યોગ્ય ગાણિતિક
અથવા આંકડાકીય સાધન
પસંદ કરવું.
ઉદાહરણ તરીકે, જો
હું સરેરાશનો અંદાજ
કાઢવા ઈચ્છું છું,
તો હું અંદાજપત્ર
તરીકે સરેરાશ, નમૂનાનો
અર્થ અથવા નમૂનો
મધ્ય પસંદ કરી શકું
છું. હવે, જ્યારે હું
નમૂનાનો અર્થ અંદાજકાર
તરીકે પસંદ કરું,
ત્યારે હું મધ્યમ
મધ્યમ પસંદ કરું
જોઈએ - તેના માટે કોઈ
સંપૂર્ણ જવાબ નથી,
પરંતુ કેટલીક સારી
માર્ગદર્શિકાઓ છે
જો મને ખબર છે કે ડેટા
આઉટલેઅર(outlier)થી મુક્ત
છે અને તે ગૌસીયન
વિતરણ(Gaussian distributed) પ્રક્રિયાની
બહાર આવે છે, નમૂનાનો
અર્થ તમને સૌથી કાર્યક્ષમ
અંદાજપત્ર આપે છે
- તમામ અંદાજોમાં
સૌથી નીચો શક્ય ભૂલનો
અંદાજ; પરંતુ જો હું
નોંધ કરું કે ડેટા
આઉટલેઅર(outlier) સાથે
સુધારી શકાય છે અને
હું મારા અંદાજપત્રને
તેનાથી પ્રભાવિત
થવા નથી માગતો, તો
નમૂનાનો અર્થ એ મજબૂત
નથી. તેનો અર્થ એ કે
તે અત્યંત સંવેદનશીલ
આઉટલેઅર(outlier) છે, તો
પછી હું નમૂના મધ્યનો
ઉપયોગ કરવો જોઈએ.
આ મારી પાસે જે જ્ઞાન
છે અને મારા પ્રાચિનક
ડેટા એનાલિસિસ( data
analysis)ના પગલાથી પ્રાપ્ત
કરેલ જ્ઞાન પર આધારિત
છે. અને આ પ્રકારનાં
નિર્ણયો દરેક તબક્કે
કરવામાં આવ્યાં છે
અને ત્યાં અનન્ય
જવાબ ન હોઈ શકે. યાદ
રાખો કે; માહિતીના
એનાલિસિસ(analysis)માં,
તમારા એનાલિસિસ(analysis)ના
દરેક તબક્કે જરૂરી
અને કોઈ પણ અનન્ય
જવાબ જરૂરી નથી પણ
અંતમાં પણ, જ્યારે
તમે કોઈ મોડેલ બનાવતા
હોવ, ત્યાં ઘણા મોડલ
હોઈ શકે છે જે આપેલ
ડેટાને સમજાવી શકે
છે અને તમને ખરેખર
આ મોડેલને પસંદ કરી
શકે છે કેટલાક માપદંડ
પર અને તેવી જ રીતે,
પૂર્વધારણા પરીક્ષણમાં,
આપણે યોગ્ય આંકડાઓને
અને અંતરનું એનાલિસિસ(analysis)
કરવાનું પસંદ કરવું
પડશે. અમને સૌ પ્રથમ
જાણવું પડશે કે ચલનનાં
સ્ત્રોત શું છે; ઓછામાં
ઓછું એકદમ સારી રીતે
અથવા મોડેલિંગમાં
અનુમાન લગાવ્યું
છે કારણ કે મેં કહ્યું
હતું કે તમને યોગ્ય
રિગ્રેસર સેટ અને
મોડેલ માળખું પસંદ
કરવું પડશે અને તે

Gujarati: 
પહેલાં, અને પહેલા
અને / અથવા ડોમેન જ્ઞાનમાં
હંમેશા પરિબળ છે.
તમે કદાચ પૂર્વજી
કંઈક જાણી શકો છો,
ભૌતિકશાસ્ત્ર અથવા
પ્રક્રિયાની સાથે
સંબંધિત નથી, પરંતુ
તે સેન્સર(sensor)ની લાક્ષણિકતાઓ
અને તેથી પર હોઇ શકે
છે અને અલબત્ત, તમે
ડોમેન અથવા ભૌતિકશાસ્ત્ર
અથવા કેમિસ્ટ્રી
અથવા બાયોલોજી વિશે
કંઈક જાણી શકો છો.
પ્રક્રિયા કે જે
તમે સરળતાથી માથાનો
દુઃખાવો માં પરિબળ
અને ઘણાબધા બચાવી
શકો છો.
અને છેલ્લે, એકવાર
તમે તમારા બધા એનાલિસિસ(analysis)
સાથે પૂર્ણ કરી લો,
આ સૌથી મહત્વનો ભાગ
છે - તમે કયા પરિણામો
મેળવ્યાં છે તેની
જાણ કરી રહ્યા છો
અને તેમને જાણ કરવી
એ ખૂબ મહત્વપૂર્ણ
પગલું છે. હંમેશા
કોઈ પરિમાણ વિષયક,
પૂર્વધારણાના પરીક્ષણનો
અંદાજ - શું તે પર્યાપ્ત
નોંધપાત્ર છે, પછી
ભલેને તમે તકથી બિન-શૂન્ય
મૂલ્ય મેળવી લીધું
હોય, પછી ભલે તમે શૂન્યથી
મેળવી હોત. તેથી, તમારે
પરિમાણના શૂન્યની
પૂર્વધારણા કસોટી
કરવી જોઈએ - તે નલ
પૂર્વધારણા છે, અને
તે પછી, આંકડાકીય
રીતે યોગ્ય રીતે
ચાલો. અને બીજું, અંદાજોમાં
આત્મવિશ્વાસ પ્રદેશો
અને ભૂલોની જાણ કરો.
હકીકતમાં, આત્મવિશ્વાસ
પ્રદેશો અને ભૂલોને
ગણતરીમાં લેવું એ
તમારા પૂર્વધારણા
પરીક્ષણનો એક અભિન્ન
ભાગ છે. અને પછી, જો
તમે મોડલ બનાવી રહ્યા
હોવ, તો પછી મોડેલ
માન્ય કરો. જ્યારે
હું અહીં મોડેલો
કહીશ, રીગ્રેસન(regression)
મોડલ ન હોવો જોઈએ,
તે ક્લાસિફાયર પણ
હોઇ શકે છે. અને જો
બહુવિધ મોડલ ઓળખી
કાઢવામાં આવે તો,
માપદંડનું મિશ્રણ
વાપરો; જેમ મેં પહેલા
ઉલ્લેખ કર્યો છે,
ત્યાં અનન્ય જવાબ
ન હોઈ શકે; સામાન્ય
રીતે, આ કેસ છે મારા
વિદ્યાર્થીઓ હંમેશા
મને પૂછે છે, મારી
પાસે ડેટાના બે કે
ત્રણ મોડલ છે, જે મને
પસંદ કરવા જોઇએ?
ઠીક છે, પ્રથમ વસ્તુ
એ છે કે તમે તમારા
ઉકેલોની સંખ્યાને
ઘટાડવા માટે ખૂબ
જ વ્યવસ્થિત પ્રક્રિયાને
અનુસરવાનું છે અને
શ્રેષ્ઠ પ્રયત્નો
હોવા છતાં તમે બહુવિધ
સોલ્યુશન્સ સાથે
સમાપ્ત થઈ શકો છો,
ખૂબ સામાન્ય.
પછી તમે લાગુ કરો
કે જે માહિતી સૈદ્ધાંતિક
પગલાં જેમ કે અકાઇક
માહિતી માપદંડ અથવા
બાયનેસિનેશન માપદંડ(Akaike
information criteria or Bayesinformation criteria)
તરીકે ઓળખાય છે. અને
મોડેલનો અંતિમ ઉપયોગ
પણ રાખવો; હોઈ શકે
છે તમારા મોડેલ ઑનલાઇન
અમલ કરી શકાય છે; તેથી,
આગાહીની ચોકસાઈ પર
બલિદાનની થોડી જટિલતા
સાથે જટિલ મોડેલને
પસંદ કરવામાં સરળ
મોડલ પસંદ કરવામાં
આવે છે. તેથી, ફરી
કોઈ અનન્ય જવાબ નથી,
પરંતુ અંતમાં, તમે
જાણ કરો છો તે અંતિમ
પરિણામો બે બાબતો
હોવા જોઈએ: તે માટે
આંકડાકીય સમર્થન
અને શા માટે તમે આ
પરિણામોની જાણ કરવાનો
નિર્ણય લીધો છે અને
શા માટે પરિણામ એ
રીતે છે તેઓ છે. તેથી,
તેથી, તમારે યાદ રાખવું
જોઈએ કે ડેટા એનાલિસિસ(
data analysis) માત્ર વિજ્ઞાન
જ નથી. હા, તેનો મોટો
ભાગ વિજ્ઞાન છે, પરંતુ
તેનો એક મહત્વપૂર્ણ

Gujarati: 
ભાગ એક કલા પણ છે.
ડેટા એનાલિસિસ( data
analysis) એટલે, વિજ્ઞાન
અને એક કલા બંને. અને
આત્મવિશ્વાસ પ્રદેશો
અને ભૂલોની જાણ કર્યા
વગર અંદાજની જાણ
ક્યારેય કરશો નહીં;
શક્ય તેટલા વધુ, તમારે
ચોક્કસપણે તે કરવું
જોઈએ. અલબત્ત, ખૂબ
જ જટિલ પરિમાણ અંદાજ
સમસ્યાઓ, વિશ્વાસ
પ્રદેશો મેળવવા માટે
ખૂબ જ મુશ્કેલ હોઈ
શકે છે, પરંતુ તમારા
શ્રેષ્ઠ પ્રયાસ છતાં
પ્રયાસ કરવો જોઈએ
... ભૂલો અને વિશ્વાસ
અંતરાલો જાણ કરવા
માટે તમારા પ્રયત્નો
શ્રેષ્ઠ મૂકવા પ્રયાસ
કરો.
આ અમુક સંદર્ભો છે
અલબત્ત, કોઈ રીતે
તે સંપૂર્ણ નથી. મેં
આ પુસ્તકોમાંથી કેટલાક
ઉદાહરણો અને કેટલીક
સામગ્રી લીધી છે;
આ એકદમ સામાન્ય પુસ્તકો
છે જે તમને રેન્ડમ
ડેટા એનાલિસિસ(data
analysis)પરનું પહેલું
પુસ્તક શોધી શકે
છે, તે તમારા માટે
ખૂબ જ ઉપયોગી છે કારણ
કે તે લોકો દ્વારા
30-40 વર્ષ માટે પ્રેક્ટિસ
કરેલ છે, જુદા જુદા
પ્રકારની માહિતી
જોવા મળે છે, અને તેઓ
પાસે ઉદાહરણો છે,
તેમનાં લખાણ પુસ્તકોમાં
ખૂબ જ સારા ઉદાહરણો.
અને બાકીના ત્રણ,
ઓછામાં ઓછા જ્હોનસન
અને મોન્ટગોમરી અને
રુંગેર(Johnson and Montgomery
and Runger) દ્વારા પુસ્તક,
તેઓ સંભાવના અને
આંકડાશાસ્ત્રમાં
એપ્લાઇડ સંભાવના
અને આંકડાશાસ્ત્રમાં
શાસ્ત્રીય પુસ્તકો
છે. ઑગ્યુનાઇક(Ogunnaike)
દ્વારા પુસ્તક તમને
ઇજનેરો માટે સંભાવના
અને આંકડાઓનું ફંડામેન્ટલ્સ
આપે છે. જો તમે ઈજનેર
છો, તો તમે ખરેખર પુસ્તકને
જોઈ શકશો. અલબત્ત,
ત્યાં સેંકડો અન્ય
પુસ્તકો છે જે તમે
સંદર્ભિત કરી શકો
છો. તેથી, આશા છે કે
તમે લેક્ચરનો આનંદ
માણ્યો હતો અને તમે
સમજી ગયા છો કે ડેટા
એનાલિસિસ( data analysis) શું
છે, તમારે કઈ સાવચેતીનાં
પગલાં લેવાય છે, અને
ડેટા એનાલિસિસ( data
analysis)માં તમારે કેટલું
કાળજી રાખવી જોઈએ,
પદ્ધતિસરની પ્રક્રિયા
શું છે, અને કેટલીક
પરિભાષા અમે આર(R)
માંના થોડા ઉદાહરણોને
ઝડપથી જોશું અને
આશા રાખીએ કે આ વ્યાખ્યાનને
પુરક કરો. આભાર.
