हमारे डेटा विज्ञान टीम के साथ साक्षात्कार – भाग 1

हाउसिंग के डेटा साइंस लैब हाउसिंग में सबसे शुरुआती टीमों में से एक था। टीम के डेटा वैज्ञानिकों ने हाउसिंग के उपयोगकर्ताओं और हमारे आंतरिक निर्णय निर्माताओं के लिए बेहतर जानकारी देने के लिए उन्नत सांख्यिकीय और मशीन सीखने के तरीकों का उपयोग किया है। दो साक्षात्कार के पहले साक्षात्कार में, पॉल मीनशेसन, विनेसा बुध्रानी, ​​और नितिन संगवान एक भविष्य के बारे में बात करते हैं; और यह कैसे क्रिकेट का सबसे अच्छा बल्लेबाज खोजने के लिए इस्तेमाल किया जा सकता है!

पॉल डेटा विज्ञान के वीपी है, नितिन एक इंजीनियरिंग प्रबंधक है, और विनीशा हाउसिंग में डेटा साइंस लैब (डीएसएल) में एक डाटा साइंटिस्ट है।

Q.1) हमें अपनी टीम का संक्षिप्त इतिहास और अवलोकन दें।

नितिन: उपयोगकर्ताओं को (किरायेदारों, खरीदार, विक्रेता) निर्णय लाभ देने के विचार पर आवास की स्थापना की गई थी। हम व्यापक डेटा लेते हैं, प्रक्रिया करते हैं और इसका विश्लेषण करते हैं, और निर्णय लेने के लिए आवश्यक जानकारी के रूप में इसे वितरित करते हैं। आंकड़ों को बदलने पर हाउसिंग के एकमात्र ध्यान केंद्रित किया गयाबेहतर निर्णय लेने की शक्ति में, डेटा साइंस लैब का गठन केवल प्राकृतिक था

हमारे डेटा वैज्ञानिकों के पास कंप्यूटर साइंस, गणित, सांख्यिकी और कम्प्यूटेशनल सोशल साइंस जैसी क्षेत्रों में विविध पृष्ठभूमि है। भारत में रियल एस्टेट डेटा वैज्ञानिकों के लिए एक खजाना खदान है और हम जल्दी से बढ़ रहे हैं हमारा उद्योग दिलचस्प और चुनौतीपूर्ण समस्याओं को प्रस्तुत करता है, इसलिए हम उच्च भर्ती मानकों को बनाए रखते हैं। हम एशिया में प्रमुख डेटा विज्ञान टीम बनना चाहते हैं

Q.2) डेटा साइंसेज लैब कुछ नवीन रेटिंग और रियल एस्टेट जैसे लाइफस्टाइल रेटिंग जैसी इंडेक्स के पीछे है। लैब के अन्य प्रकार के काम क्या करते हैं?

विनीषा: रेटिंग्स और इंडेक्स हाउसिंग में डेटा साइंस का सिर्फ एक पहलू है। जैसा कि आप हमारी वेबसाइट को ब्राउज़ करते हैं, हमारे बहुत सारे काम, दृश्यों के पीछे हो रहे हैं। उदाहरण के लिए, हम लगातार देख रहे हैं कि एक व्यक्ति क्या देख रहा है और प्रतिक्रिया में सबसे उपयुक्त सूची प्रदान करने का प्रयास कर रहा है।

हम ??? यह सुनिश्चित कर लें कि हमारी सूचीें जल्दी से बढ़ीं और ये कि वे वर्तमान बने रहें इसमें दिलचस्प अनुमान की समस्याएं और साथ ही भविष्य कहनेवाला मॉडलिंग शामिल है। हम अपने संचालन, व्यवसाय और विक्रय टीमों को अंतर्दृष्टि भी प्रदान करते हैं। हम उन्हें संसाधन उपयोग का अनुकूलन करने और महत्वपूर्ण व्यापार-नापसंदों को हल करने में सहायता करते हैं। हम नियमित रूप से नए और रोमांचक कामों का विकास कर रहे हैं, इसलिए देखते रहें! <img src = "https://housing.com/oldblog/wp-includes/images/smilies/icon_smile.gif" {Q.3) कई विश्वविद्यालयों ने परिचय किया हैडी एम विशेषज्ञता में अपने एमबीए कार्यक्रमों या बिग डेटा के लिए स्नातकोत्तर पाठ्यक्रमों में एनालिटिक्स में उम्मीद है कि यह ‘अगली बड़ी बात’ है क्या उनका उत्साह गलत है?

पॉल: उनका उत्साह अच्छी तरह से स्थापित है हाउसिंग में शामिल होने से पहले टेराडाटा की इंटरनेशनल डेटा साइंस टीम के लिए एशिया में प्रमुख डेटा वैज्ञानिक थे I जापान और दक्षिण कोरिया से भारत और पाकिस्तान तक, टेराटाटा क्लाइंट ने पहले प्रश्नों में से एक पूछा था कि वे डेटा वैज्ञानिकों को कैसे प्राप्त कर सकते हैंऔर एक डेटा विज्ञान टीम का निर्माण वहाँ बहुत सारे डेटा है वहाँ किया करने के लिए बाहर काम करते हैं और बहुत कम लोग इसे करने के लिए। इसलिए यह समझ में आता है कि यूनिवर्सिटी उस मांग के अनुरूप होंगे।

हालांकि, मुझे नहीं लगता कि एक अकादमिक कार्यक्रम या विशेषता विकसित करने से समस्या का समाधान होगा या कल के डेटा वैज्ञानिकों के बहुमत की आपूर्ति करेगा। इसके बजाय, अगर मैं किसी भी संबंधित क्षेत्रों में मौजूदा कार्यक्रमों के प्रभारी थे – कंप्यूटर विज्ञान, सांख्यिकी, गणित, कम्प्यूटेशनल सोशल साइंस, इंजीनियरिंग – मैं अपने छात्रों को विभिन्न प्रकार के डोमेन में अपने कौशल को गोल-आउट करने में मदद करने पर ध्यान केंद्रित करता हूं। और मैं वास्तव में नए विचारों और स्थापित तरीकों के नए अनुप्रयोगों के लिए जिज्ञासा की बढ़ती भावना और खुलेपन को विकसित करने में मदद करने पर ध्यान केंद्रित करता हूं।

Q.4) डेटा साइंस पेज का कहना है कि ‘डेटा नई मिट्टी है’ आपके काम के लिए इसका क्या मतलब है?

विनीशा: डेविड मैककैन्डलेस द्वारा दिए गए उद्धरण पढ़ता है: “डेटा नई तेल है? नहीं: डेटा वें हैई नई मिट्टी ” हम इस तरह की व्याख्या करते हैं। हमारे पास डेटा का एक टन है इसमें प्रत्येक उपयोगकर्ता, लिस्टिंग और उनके विशेषताओं, साथ ही पड़ोस, समुदायों और शहरों की प्रत्येक कार्रवाई के डेटा शामिल हैं, जहां उन लिस्टिंग स्थित हैं। लेकिन तेल एक गैर-नवीकरणीय संसाधन है जिसे आप मेरा उपयोग करते हैं, और फिर यह चला जाता है।

दूसरी ओर, हमारा डेटा एक अक्षय संसाधन है जो लगातार नए रूपों का उत्पादन करने के लिए पुन: उपयोग किया जाता है जो बदले में एक अच्छे चक्र में नए डेटा में वापस फ़ीड करता है। जम्मू के बजायहमारे शस्त्रागार में एक महत्वपूर्ण संपत्ति के रूप में डेटा को देखकर और एक बार उपयोग करते हुए, हम उपयोगकर्ता अनुभव को बढ़ाने के लिए नए और व्यावहारिक उत्पादों को विकसित करने के लिए इसका उपयोग करने का प्रयास करते हैं। और जैसा कि उन उत्पादों का उपयोग किया जाता है, वे नए डेटा का उत्पादन करते हैं और भविष्य में नए उत्पादों के पोषक तत्वों को उपलब्ध कराने और कल के उपयोगकर्ताओं के लाभ के लिए मिट्टी में लौट जाते हैं।

Q.5) हमारे पास क्रिकेट में गेंद के कब्जे और कुछ समय के लिए क्रिकेट में गेंद-दर-गेंद के आंकड़ों पर डेटा था। फिर भी, बिग डेटा और एनालिटिक्स को कम से कम भूमिका मिली हैखिलाड़ियों के चयन में खेलने के लिए आपको कब लगता है कि मनीबॉल मॉडल को सभी खेलों में दोहराया जाएगा? क्या आपको लगता है कि आप एक रेटिंग प्रणाली के साथ आ सकते हैं जो कि प्रारूपों और युगों में बता सकता है जो क्रिकेट का सबसे अच्छा बल्लेबाज है?

नितिन: मुझे लगता है कि कई विश्लेषिकी पहले से ही खिलाड़ियों के चयन में और साथ ही अन्य स्पोर्ट्स के विशिष्ट फैसले भी बनाते हैं, जैसे किसी विशेष टीम के खिलाफ खेल में एक विशेष खिलाड़ी क्या भूमिका निभाएंगे। यह सिर्फ टी हैटोपी इसमें से अधिकांश वर्तमान में ‘एक्सेल शीट’ आधारित है कुछ संगठन पहले से ही इस विचार पर काम कर रहे हैं और उत्कृष्ट उपकरणों के साथ आए हैं ताकि खेल के आंकड़ों को देखने के लिए डिब्बों की मदद की जा सकें और टीम डेटा के मुकाबले ठोस आंकड़े दूर ले जा सकें (अर्थात लाइबोरो की जांच करें)।

एक रेटिंग प्रणाली के लिए, ठीक है, निश्चित रूप से एक रेटिंग प्रणाली को आसानी से डिज़ाइन किया जा सकता है। हालांकि, सबसे महत्वपूर्ण काम एक रूप में ‘सर्वश्रेष्ठ’ को परिभाषित करना होगा जो व्यापक रूप से स्वीकार्य होगा। कुछ लोग कह सकते हैं कि जब एक बल्लेबाज अच्छा होता हैऔसत अच्छा है दूसरों की भलाई के एक बेहतर उपाय के रूप में लगातार प्रदर्शन को पसंद कर सकते हैं एक परिभाषा आने के बाद, रेटिंग केवल इस महत्वपूर्ण परिभाषा का एक कार्य होगा जो इस परिभाषा को जोड़ते हैं। इसके अलावा, मुझे लगता है कि एक और रोचक समस्या का बयान होगा: अच्छाई के इस उपाय को देखते हुए, भविष्य में युवा खिलाड़ियों में से कौन सा अगला ब्रैडमैन होगा?

Q.6) बिग डेटा की आम आलोचनाओं में से एक यह है कि इसका वादा अनुवाद नहीं किया गया हैप्रदर्शन में घ; यह केवल प्रवृत्तियों और सहसंबंधों की पहचान करने में सक्षम नहीं है, बयानों और भविष्यवाणियां नहीं है आप इसका जवाब कैसे देते हैं?

नितिन: डेटा पर आधारित एक मॉडल केवल मूल समस्या बयान के निर्माण के साथ-साथ ही प्रदर्शन करता है। समस्या वक्तव्य को सही ढंग से परिभाषित करना नौकरी का 90% है, मॉडल को तैयार करना अगले 1% है और उस मॉडल पर चलना अंतिम 9% है। जब भी कोई मॉडल विफल रहता है, तो सबसे पहले आपको समस्या बयान फिर से आना चाहिएइस्तेमाल किया मॉडल

दूसरा मुद्दा यह है कि अनुमानित पैरामीटर को सही ढंग से परिभाषित करने में बहुत महत्वपूर्ण होने का महत्व है। कोई नहीं पूछ सकता, यह देखते हुए कि कल कल गर्म था, मुझे अपना पैसा कहां से निवेश करना चाहिए? यह “कचरा, कचरा बाहर” के सिद्धांत का अनुसरण करता है

मैं कहूंगा कि बहुत सी आलोचना इस मुद्दे पर जोर देने की कमी से प्रेरित है। ऐसे कई उद्योग हैं जो बड़े डेटा से बेहद लाभान्वित हुए हैं। कुछ अच्छे उदाहरण क्रेडिट कार्ड धोखाधड़ी, वित्तीय योजना तैयार करेंगेअल उत्पादों, और इशारों और आवाज की पहचान के साथ मानव कंप्यूटर परस्पर क्रिया सुधार।

DSL टीम के साथ साक्षात्कार के भाग 2 के लिए बने रहें, जल्द ही आ रहा है!

देश में सर्वश्रेष्ठ डाटा साइंसेज टीम में से एक के साथ एक रोमांचक कैरियर के अवसर में दिलचस्पी है? हमारे वर्तमान नौकरी के उद्घाटन के बारे में देखें, और यहां आवेदन करें: housing.com/careers

Was this article useful?
  • ? (0)
  • ? (0)
  • ? (0)

Recent Podcasts

  • प्रधानमंत्री आवास योजना (ग्रामीण) सूची: आवेदन से लेकर लिस्ट जारी होने तक जानें पूरी जानकारीप्रधानमंत्री आवास योजना (ग्रामीण) सूची: आवेदन से लेकर लिस्ट जारी होने तक जानें पूरी जानकारी
  • संपत्ति हस्तांतरण के लिए अनापत्ति प्रमाण पत्र और विभिन्न प्रकार के एनओसी के बारे में जानेंसंपत्ति हस्तांतरण के लिए अनापत्ति प्रमाण पत्र और विभिन्न प्रकार के एनओसी के बारे में जानें
  • 2025-26 के लिए सर्वश्रेष्ठ गृह प्रवेश मुहूर्त, महीने के अनुसार यहां देखें पूरी लिस्ट2025-26 के लिए सर्वश्रेष्ठ गृह प्रवेश मुहूर्त, महीने के अनुसार यहां देखें पूरी लिस्ट
  • 2025-26 में घर निर्माण के लिए भूमि पूजन के शुभ मुहूर्त की तिथियां2025-26 में घर निर्माण के लिए भूमि पूजन के शुभ मुहूर्त की तिथियां
  • सिडको लॉटरी 2025 के तहत नवी मुंबई में मिलेंगे 22,000 नए घर, जानिए ऑनलाइन आवेदन करने की पूरी प्रोसेससिडको लॉटरी 2025 के तहत नवी मुंबई में मिलेंगे 22,000 नए घर, जानिए ऑनलाइन आवेदन करने की पूरी प्रोसेस
  • भू नक्शा राजस्थान 2025: ऑनलाइन कैसे चेक सकते हैं? जानें हर जानकारीभू नक्शा राजस्थान 2025: ऑनलाइन कैसे चेक सकते हैं? जानें हर जानकारी