ईमेल पते कैसे निकालें
कभी-कभी आपने अपनी वेबसाइट या व्यावसायिक सॉफ़्टवेयर से डेटा निर्यात किया होगा।
जिसमें ऑर्डर की जानकारी या ग्राहक का विवरण शामिल हो।
आपको शायद केवल ईमेल पता और ऑर्डर की तारीख की ही आवश्यकता रही होगी।
एक तरीका यह है कि सभी डेटा को एक्सेल में आयात करें और अनावश्यक कॉलम हटा दें।
और बाकी बचे हुए को निर्यात करें।
This may not work well if the email field also contains the email address description,
for example: “Dave Martin <davemartin@bogusemail.com>”.
अगर आपको इस काम को कई बार दोहराना पड़े तो यह असुविधाजनक हो सकता है।
या फिर यदि आपको किसी और को सभी चरणों को समझाना पड़े।
रेगुलर एक्सप्रेशन (regex) का उपयोग करके वांछित डेटा निकालें।
एक रेगुलर एक्सप्रेशन (संक्षेप में “regex” या “regexp”),
यह वर्णों का एक क्रम है जो पाठ में एक मिलान पैटर्न को निर्दिष्ट करता है।
एक बहुत ही सरल उदाहरण है किसी शब्द को टेक्स्ट एडिटर में दो अलग-अलग तरीकों से लिखे हुए ढूंढना।
नियमित अभिव्यक्ति सीरियली[sz]ई यह “serialise” और “serialize” दोनों से मेल खाता है।
पाठ में पहचान करने के लिए वाक्य संरचना अधिक जटिल स्थिति है।
-
ईमेल पते:
[a-zA-Z0-9._-]+@[a-zA-Z0-9._-]+\.[a-zA-Z0-9_-]+
स्रोत: स्टैकओवरफ्लो - रेगुलर एक्सप्रेशन का उपयोग करके स्ट्रिंग से ईमेल निकालें -
एक तिथि:
\d{4}-\d{2}-\d{1,2}
स्रोत: स्टैकओवरफ्लो - स्ट्रिंग से तिथि निकालने के लिए रेगुलर एक्सप्रेशन
रेगुलर एक्सप्रेशन (Regex) ट्यूटोरियल
अनुशंसित YouTube वीडियो
“38 मिनट का समय बहुत अच्छे से बीता, बिल्कुल सार्थक रहा”
किसी भी टेक्स्ट पैटर्न का मिलान कैसे करें
(25वें मिनट से ईमेल पते निकालने के लिए सिंटेक्स की व्याख्या की गई है)
रेगुलर एक्सप्रेशन का उपयोग करने के लिए चीट शीट
RegExr ऑनलाइन टूल
नियमित अभिव्यक्तियाँ आम तौर पर स्वीकार्य हैं
नोटपैड++ या एटम जैसे उन्नत टेक्स्ट एडिटर्स के भीतर।
मुफ्त ऑनलाइन उपकरण भी उपलब्ध हैं, उनमें से एक यह है:
https://regexr.com - रेगुलर एक्सप्रेशन सीखने, बनाने और परीक्षण करने के लिए एक ऑनलाइन सेवा।
वेब इंटरफेस की व्याख्या:
“एक्सप्रेशन” वह फ़ील्ड है जिसमें रेगुलर एक्सप्रेशन सिंटैक्स होता है।
"पाठ" वह सामग्री है जिसका आप विश्लेषण करना चाहते हैं।
“टूल्स > लिस्ट” पर क्लिक करने से एक्सट्रैक्शन के परिणाम दिखाई देंगे।
उदाहरण 1: केवल ईमेल पता निकालने के लिए
अभिव्यक्ति:
[a-zA-Z0-9._-]+@[a-zA-Z0-9._-]+\.[a-zA-Z0-9_-]+
मूलपाठ:
डेव मार्टिन 615-555-7164 173 मेन स्ट्रीट, स्प्रिंगफील्ड आरआई 55924 davemartin@bogusemail.com चार्ल्स हैरिस 800-555-5669 969 हाई स्ट्रीट, अटलांटिस वीए 34075 charlesharris@bogusemail.com एरिक विलियम्स 560-555-5153 806 फर्स्ट स्ट्रीट, फेकटाउन एके 86847 laurawilliams@bogusemail.comउपकरण > सूची:
$&\n
परिणाम:
davemartin@bogusemail.com charlesharris@bogusemail.com laurawilliams@bogusemail.comउदाहरण 2: ईमेल पता और तिथि निकालने के लिए
अभिव्यक्ति:
","(.*?)([a-zA-Z0-9._-]+@[a-zA-Z0-9._-]+\.[a-zA-Z0-9_-]+)(.*?)",.*",(\d{2}\.\d{2}\.\d{4})
मूलपाठ:
"lorem ipsum dolor sit amet","Robert Farrell <rmfarrell@bogusemail.com>","",02.01.2024, ,5379,
"consectetur adipiscing elit","""Mesa, Rene <rmesa@bogusemail.com>""","",04.01.2024, ,20826,
"sed do eiusmod tempor incididunt","Antonio Bugan <antonio@bogusemail.com>","",04.01.2024, ,2856,
"ut labore et dolore magna aliqua","Crawley Down Tennis Club <hello@bogusemail.com>","",05.01.2024, ,4453,उपकरण > सूची:
$2, $4\n
परिणाम:
rmfarrell@bogusemail.com, 02.01.2024 rmesa@bogusemail.com, 04.01.2024 antonio@bogusemail.com, 04.01.2024 hello@bogusemail.com, 05.01.2024रेगुलर एक्सप्रेशन का उपयोग करने के लिए चीट शीट
. - Any Character Except New Line
\d - Digit (0-9)
\D - Not a Digit (0-9)
\w - Word Character (a-z, A-Z, 0-9, _)
\W - Not a Word Character
\s - Whitespace (space, tab, newline)
\S - Not Whitespace (space, tab, newline)
\b - Word Boundary
\B - Not a Word Boundary
^ - Beginning of a String
$ - End of a String
[] - Matches Characters in brackets
[^ ] - Matches Characters NOT in brackets
| - Either Or
( ) - Group
Quantifiers:
* - 0 or More
+ - 1 or More
? - 0 or One
{3} - Exact Number
{3,4} - Range of Numbers (Minimum, Maximum)स्रोत: गिटहब कोड स्निपेट्स