วันอาทิตย์ที่ 23 สิงหาคม พ.ศ. 2563

วิทยาการข้อมูล(data science)

 
วิทยาการข้อมูล( Data Science )

วิทยาการข้อมูล  (Data science)  เป็นสหสาขาวิชาที่ใช้วิธีการ กระบวนการ อัลกอริทึม และระบบทางวิทยาศาสตร์มาใช้เพื่อหาความรู้จากข้อมูลหลากหลายรูปแบบทั้งจัดเก็บเป็นระเบียบและไม่เป็น ระเบียบเป็นสาขาที่เกี่ยวข้องกับ การทำเหมืองข้อมูล การเรียนรู้เชิงลึก และ ข้อมูลขนาดใหญ่

เก็บและวิเคราะห์ข้อมูลจาก Internet - ฟรีแลนซ์อื่นๆ ...

     วิทยาการข้อมูลเป็นศาสตร์ที่เป็นการบูรณาการสถิติศาสตร์ การวิเคราะห์ข้อมูล และการเรียนรู้ของเครื่องเข้าด้วยกันเพื่อให้สามารถเข้าใจและวิเคราะห์ปรากฏการณ์ที่เกิดขึ้นจริงในข้อมูลได้ใช้เทคนิคและทฤษฎีที่ได้มาจากคณิตศาสตร์ สถิติศาสตร์

       จิม เกรย์ นักวิทยาศาสตร์ผู้ได้รับรางวัลทัวริงมองว่า วิทยาการข้อมูลเป็นวิทยาศาสตร์แขนงที่สี่ ต่อยอดมาจาก วิทยาศาสตร์การทดลอง วิทยาศาสตร์ทฤษฎี และวิทยาศาสตร์เชิงคำนวณ โดยเชื่อว่าทุกอย่างที่เกี่ยวข้องกับวิทยาศาสตร์กำลังจะเปลี่ยนไปโดยอิทธิพลของเทคโนโลยีสารสนเทศและการเพิ่มขึ้นของข้อมูล

พื้นฐาน
      วิทยาการข้อมูลเป็นสหสาขาวิชาที่มุ่งเน้นการหาความรู้จากกลุ่มข้อมูลซึ่งส่วนมากมักมีขนาดใหญ่ ครอบคลุมตั้งแต่การเตรียมข้อมูลเพื่อวิเคราะห์ วิเคราะห์ และนำเสนอสิ่งที่ค้นพบให้กับผู้มีอำนาจใจการตัดสินใจในองค์กร จึงต้องใช้ทักษะทางด้านวิทยาการคอมพิวเตอร์ คณิตศาสตร์ สถิติศาสตร์ การนำเสนอข้อมูลด้วยภาพ การออกแบบกราฟิก และธุรกิจ

     นักสถิติศาสตร์หลายคน อาทิ เนท ซิลเวอร์ มองว่าวิทยาการข้อมูลไม่ได้เป็นศาสตร์ใหม่ แต่เป็นอีกชื่อหนึ่งของสถิติศาสตร์ แต่บ้างก็แย้งว่าวิทยาการข้อมูลเน้นการศึกษาปัญหาและเทคนิคที่แตกต่างกับวิชาสถิติ โดยวิสันต์ ธาร์ ศาสตราจารย์ที่มหาวิทยาลัยนิวยอร์กมองว่าสถิติจะเน้นการศึกษาข้อมูลเชิงปริมาณและหาคำอธิบาย ส่วนวิทยาการข้อมูลจะเน้นศึกษาทั้งข้อมูลเชิงปริมาณและเชิงคุณภาพ (เช่นภาพ) และเน้นการพยากรณ์และการลงมือทำ

เส้นทางอาชีพ
     วิทยาการข้อมูลเป็นศาสตร์ที่กำลังเติบโต นักวิทยาการข้อมูลเป็นอาชีพหนึ่งที่ได้รับเงินเดือนระดับที่สูงมากในสหรัฐอเมริกา โดยมีค่ามัธยฐานอยู่ที่ 118,370 ดอลลาร์สหรัฐต่อปี หรือประมาณ 56.91 ดอลลาร์ต่อชั่วโมง การเติบโตของสายงานสูงกว่าค่าเฉลี่ยของแรงงานในตลาด คาดว่าจะเติบโตราวร้อยละ 16 ระหว่างปี ค.ศ. 2018 ถึง ค.ศ. 2028

สาขาเฉพาะทางของวิทยาการข้อมูล
  • นักวิทยาศาสตร์การเรียนรู้ของเครื่อง มีหน้าที่วิจัยหาวิธีการวิเคราะห์ข้อมูบแบบใหม่และสร้างอัลกอริทึม
  • นักวิเคราะห์ข้อมูล ใช้ข้อมูลขนาดใหญ่เพื่อรวบรวมข้อมูลที่ตรงตามความความสนใจของบริษัท
  • ที่ปรึกษาด้านข้อมูล ทำงานร่วมกับภาคธุรกิจเพื่อศึกษาว่าจะใช้ข้อมูลจากการวิเคราะห์ให้เกิดประโยชน์ได้อย่างไร
  • สถาปนิกข้อมูล สร้างโซลูชันข้อมูลที่เหมาะสมกับการนำไปใช้งาน
  • สถาปนิกการนำไปใช้งาน ติดตามการนำไปใช้งานตลอดทั้งวงจรธุรกิจ

เทคโนโลยีเเละเทคนิค
 เทคนิค
เทคโนโลยี
  • ภาษาไพธอน เป็นภาษาคอมพิวเตอร์ที่ใช้กันทั่วไปในวงการวิทยาการข้อมูล มีไลบรารีให้เลือกใช้มากมาย
กังหัน แบ่งปันความรู้ดีๆ เพื่อคนไทย: Python (ตอน 2) : วิธีติดตั้ง ...

  • ภาษาอาร์ เป็นภาษาคอมพิวเตอร์ที่ใช้สำหรับการวิเคราะห์ทางสถิติและการทำเหมืองข้อมูล
Formation Langage R | Human Coders Formations


TensorFlow for R



Welcome to PyTorch Tutorials — PyTorch Tutorials 1.6.0 documentation

  • Jupyter เป็นส่วนติดต่อกับผู้ใช้รูปแบบเว็บสำหรับการเขียนภาษาไพธอนที่ทำให้การทำงานสะดวกขึ้น
Jupyter Lab extensions for Data Scientist | by Alexander Osipenko ...



  • Tableau Software ใช้สำหรับการนำเสนอข้อมูลด้วยภาพ
Salesforce acquires analytics platform Tableau


  • อะแพชีฮาดูป เป็นเฟรมเวิร์คสำหรับประมวลผลข้อมูลขนาดใหญ่ในระบบปฏิบัติการเชิงกระจาย











































































































































































































ยุค 5G/6G , Iot , AI

ยุค  5G/6G ,  Iot  , AI

5G คืออะไร? เทคโนโลยีสื่อสารไร้สายน้องใหม่ ใกล้ตัวกว่าที่คิด
ช่วงนี้ใครหลายๆคนอาจได้ยินคำว่า 5G กันมาบ้าง แล้ว 5G คืออะไร? วันนี้เราจะมาหาคำตอบกัน 5G คือ Generation ใหม่ของเทคโนโลยีเครือข่ายไร้สายที่จะมาแทนที่ระบบ 4G ที่เรากำลังใช้อยู่ในปัจจุบัน ซึ่งมันจะไม่จำกัดแค่มือถือเท่านั้น แต่รวมถึงอุปกรณ์ทุกชนิดที่เชื่อมอินเตอร์เน็ตได้
(Internet of Things หรือ IoT)
5G เหนือกว่า 4G อย่างไร?

ตอบสนองไวขึ้น สามารถสั่งงาน และควบคุมสิ่งต่างๆ ได้อย่างรวดเร็ว หรือเรียกว่าแทบจะทันที เนื่องจากมีความหน่วงที่ต่ำ ตอบสนองได้ไวถึง 1 ส่วนพันวินาที
รองรับการ รับ-ส่ง ข้อมูลได้มากกว่า ถ้าเป็น 4G จะสามารถ รับ-ส่ง ข้อมูลได้ราว 7.2 Exabytes ต่อเดือน แต่สำหรับ 5G จะเพิ่มขึ้นราว 7 เท่า หรือ 50 Exabytes ต่อเดือน
เร็วแรงกว่าเดิม 5G มีความเร็วมากกว่า 4G ถึง 20 เท่า ซึ่งเร็วมากพอที่จะดูวิดีโอ 8K ออนไลน์แบบ3มิ ติ หรือดาวน์โหลดภาพยนตร์ 3 มิติ ได้ในภาย 6 วินาที
ความถี่ให้เลือกใช้มากกว่า 5G จะสามารถใช้งานคลื่นความถี่ได้จนถึง 30GHz ซึ่งเป็นความถี่ย่านใหม่ที่ไม่เคยมีการใช้งานมาก่อน
รองรับการใช้งานที่มากกว่า รองรับจำนวนผู้ใช้งานเพิ่มขึ้น 10 เท่า จากที่สามารถรับคนได้ราว 1 แสนคนต่อพื้นที่ 1 ตร.กม. กลายเป็น 1 ล้านคนต่อพื้นที่ 1 ตร.กม.

ประโยชน์ของ 5G

  สำหรับคุณสมบัติหลักเด่นชัดของ 5G ที่เห็นได้ชัดเลยคงเป็นเรื่องของคุณภาพการรับชมวีดีโอ หรือการเล่นเกมส์ออนไลน์ ที่ช่วยให้ผู้ใช้บริการได้สัมผัสกับคุณภาพความคมชัด และความรวดเร็วเทียบเท่ากับการใช้งานผ่านโครงข่ายใยแก้วนำแสง (Fiber Optic) หรือการที่สามารถทำงานและเข้าถึงข้อมูลทุกอย่างที่อยู่บน Cloud ไม่ว่าจะรูปแบบภาพ หรือวิดีโอ ได้แบบทันทีที่ต้องการ รวมถึงการพัฒนาเทคโนโลยีให้มีความเร็วในการดาวน์โหลดและอัพโหลดที่สูงกว่าเทคโนโลยี 4G อีกด้วยนอกจากนี้ เทคโนโลยี 5G ยังถูกออกแบบมาเพื่อรองรับการเชื่อมต่อจำนวนมากๆ ผ่านอินเตอร์เน็ต หรือที่เรียกกันว่า IoT อาทิ รถยนต์ไร้คนขับ การผ่าตัดได้จากระยะไกล หุ่นยนต์ในโรงงาน





6G คืออะไร และมีแนวโน้มอย่างไรในอนาคต
  คุณผู้อ่านคงเคยได้ยินคำว่า 5g กันมาบ้าง ซึ่งคำนี้บ่งบอกถึงความเร็วในการเชื่อมต่ออินเทอร์เน็ตรวมทั้งการสร้างการสื่อสารที่มีความรวดเร็วในระดับสูง แต่คุณก็อาจจะยังไม่คุ้นเคยกับคำว่า 6g กันสักเท่าไหร่นัก ซึ่งเรามาดูกันดีกว่า6g นี้มีความสำคัญกว่า 5g อย่างไร
6G ดีกว่าอย่างไร?
  ซึ่งความแตกต่างอันดับ 1 ก็คือในเรื่องของความเร็ว โดยในปัจจุบันนี้ 6g กำลังอยู่ในขั้นตอนของการพัฒนา แต่ก็มีการวิเคราะห์คาดการณ์กันว่าความเร็วของ 6g  นั้นจะอยู่ที่ประมาณ 1 TERABIT/วินาทีหรือพูดง่ายๆ ก็คือประมาณ 100 เท่าของ 5g และจะมีในเรื่องของ AI เข้ามาเกี่ยวข้องด้วย สำหรับความเร็วในระดับนี้จะทำให้การประมวลผลของ AI เชื่อมต่อการทำงานได้อย่างรวดเร็ว อีกทั้งยังมีความสามารถในการช่วยแก้ไขปัญหาให้ผู้ใช้งานได้ทันที ถึงแม้ปัญหานั้นจะมีความซับซ้อนมากก็ตาม ยกตัวอย่างให้เห็นภาพ เช่น ในเมือง NEW YORK ประเทศสหรัฐอเมริกาใน 1 วันจะมีรถยนต์จำนวนประมาณ 3 ล้านคันวิ่งเข้าออกในเมืองหลวงตลอดเวลา เพราะฉะนั้นสมองกล AI จะทำการประมวลผล เพื่อขับเคลื่อนรถยนต์ไร้คนขับได้อย่างมีประสิทธิภาพมาก โดยที่ไม่ก่อให้เกิดอุบัติเหตุหรือปัญหาในเรื่องของรถติดจำนวนมหาศาลเลย



AI คือเทคโนโลยีสมองกลคอมพิวเตอร์ที่สามารถคิดได้เหมือนมนุษย์

   AI ย่อยมาจาก   Artificial  Intelligence   หรือแปลเป็นไทยว่า  “ปัญญาประดิษฐ์”    เป็นระดับขั้นหนึ่งใน
วิทยาการคอมพิวเตอร์ คำว่า AI ถูกพูดถึงในวงกว้างมากว่า 20 ปีแล้ว ช่วงที่พีคสุด ๆ ก็มีหนังฮอลลีวู้ดออกมาในชื่อเรื่อง Artificial Intelligence: AI กำกับโดย สตีเวน สปิลเบิร์ก เมื่อปี 2001 
พื้นฐานของ AI คือเทคโนโลยีที่ถูกออกแบบให้มีระบบทำงานเหมือนกับการทำงานของสมองมนุษย์ , AI ที่ใช้กันในวงกว้างทุกวันนี้ ไม่ได้มีจุดมุ่งหมายจะเลียนแบบการทำงานให้เหมือนกับสมองมนุษย์เสียทีเดียว แต่สิ่งที่มุ่งหวังคือ “output” ของ AI จะสามารถตอบโต้กับผู้ใช้ได้โดยตรง ปัจจุบันซอฟต์แวร์หลาย ๆ ตัวที่ขับเคลื่อนด้วยระบบ AI นั้น ต่างก็ต้องการให้ผู้ใช้ได้รู้สึกเหมือนตอบโต้กับมนุษย์ด้วยกันให้ได้มากที่สุด

AI ที่ถูกสร้างขึ้นมาใหม่ก็ไม่ได้สมบูรณ์แบบพร้อมเช่นเดียวกับมนุษย์ที่เกิดใหม่ ต่างก็ต้องเรียนรู้และนำมาประยุกต์ใช้ การเรียนรู้ของ AI เหมือนกับมนุษย์ คือรับรู้ข่าวสาร ข้อมูล แล้วนำมาประมวลผล จากนั้นก็จัดเก็บ เพื่อนำมาประยุกต์ใช้ในอนาคต ยกตัวอย่างแนวทางการเรียนรู้ของ AI เสมือนเด็กคนหนึ่ง ที่เคยไปจับเตาแล้วรู้สึกร้อน สมองรับรู้ความเจ็บปวด ก็จดจำไว้แล้วก็จะไม่ทำเช่นนั้นอีก

ส่วนประกอบของ AI



 Big data

Big Data คือ 

บิ๊กดาต้า (Big Data) คือคำนิยามของข้อมูลที่มีขนาดใหญ่ทุกชนิดที่อยู่ในองค์กรของเราไม่ว่าจะเป็น ข้อมูลบริษัท ข้อมูลลูกค้า Suppliers พฤติกรรมผู้บริโภค Transaction ไฟล์เอกสารต่างๆที่เกี่ยวข้องทั้งหมด รวมไปจนถึง รูปภาพ URLs ลิงค์ต่างๆที่คุณเก็บไว้ ฯลฯ ที่มีปริมาณมากจนกระทั่งซอฟต์แวร์ปกติทั่วไปไม่สามารถรองรับการเก็บข้อมูลหรือประมวลผลได้อย่างเต็มประสิทธิภาพ 

ซึ่งอีกนัยนึง Big Data คือเทคโนโลยีและสถาปัตยกรรมหรือ Platform ไอทีรุ่นใหม่ ซึ่งอาจมาในรูปแบบซอฟต์แวร์ ที่สามารถรองรับการจัดเก็บ การจัดการ กรองเลือกข้อมูล การวิเคราะห์ แสดงผล และการใช้งานข้อมูลที่มีคุณลักษณะดังต่อไปนี้


คุณลักษณะของ Big Data (4V)

1.ที่มีปริมาณมาก (Volume) ปัจจัยข้อแรกแน่นอนว่าคำว่า Big Data มีคำว่า “Big” นั่นก็คือข้อมูลที่มีขนาดใหญ่ ซึ่งสามารถเป็นได้ทั้งรูปแบบ Online และ Offline ซึ่งส่วนมากแล้วจะมีปริมาณมากกว่าหน่วย TB (Terabyte) ขึ้นไป
2.มีการเปลี่ยนแปลงอย่างรวดเร็ว (Velocity) ส่งผ่านข้อมูล Update กันอย่างต่อเนื่อง (Real-time) จนทำให้การวิเคราะห์ง่ายๆแบบ Manual เกิดข้อจำกัด หรือไม่สามารถจับรูปแบบหรือทิศทางของข้อมูลได้
3.หลากหลายประเภทหรือแหล่งที่มา (Variety) หมายถึงรูปแบบของข้อมูลที่แตกต่างกันออกไป ทั้งในรูปแบบ ตัวอักษร วิดีโอ รูปภาพ ไฟล์ต่างๆ ฯลฯ และหลากหลายแหล่งที่มาเช่น Social Network หรือ Platform E- Commerce ต่างๆ
4.ยังไม่ผ่านการประมวลผล (Veracity) ยังไม่ผ่านการ Process ให้อยู่ในรูปแบบของข้อมูลดิบ (Raw Data) ที่สามารถใช้สร้างประโยชน์ต่อองค์กรได้ 


แล้วทำไม Big Data ถึงมีความสำคัญ ?

Big Data ช่วยให้คุณสามารถใช้ข้อมูลจากทุกแหล่งที่เป็นไปได้ และวิเคราะห์เพื่อให้ได้ผลลัพธ์ที่คุณต้องการ ซึ่งช่วยให้คุณสามารถเข้าใจผู้บริโภคได้มากขึ้น (Customer Insight) ลดต้นทุนได้ ลดเวลาระยะเวลาดำเนินการ และสามารถตัดสินใจได้อย่างแม่นยำมากขึ้น ปัจจุบันหลายบริษัทได้นำ Big Data มาประยุกต์ใช้ในส่วนของการขายและการตลาดของธุรกิจ เครื่องมือที่ใช้สำหรับการรองรับ Big Data แบบที่เราเข้าใจได้ง่ายๆ และเห็นอยู่บ่อยๆ ก็อย่างเช่น Google Analytics หรือ ระบบ ERP เป็นต้น

วันจันทร์ที่ 10 สิงหาคม พ.ศ. 2563

“ข้อมูล” กำลังเป็นสิ่งมีค่ามากกว่า “น้ำมัน”

 


 “ข้อมูล” กำลังเป็นสิ่งมีค่ามากกว่า “น้ำมัน”

หากเป็นเมื่อ 10 ปีที่แล้ว คงไม่มีใครคาดคิดว่า ราคาน้ำมันจะดิ่งลงมากขนาดนี้
เพราะเรารู้กันดีว่า น้ำมันเป็นทรัพยากรที่มีอยู่อย่างจำกัด
ดังนั้นน้ำมันน่าจะมีราคาแพงขึ้นเรื่อยๆ ด้วยซ้ำแต่โควิด-19 ก็ได้พิสูจน์ให้เราเห็นแล้วว่าความเชื่อนั้นไม่เป็นจริงเสมอไปเพราะในวันที่คนออกจากบ้านน้อยลง เดินทางน้อยลงน้ำมันที่เคยมีค่าในวันนั้นกลับกลายเป็นของที่ผลิตได้มากล้น จนเกินกักเก็บได้เป็นเรื่องประหลาดที่สิ่งที่มีค่ามากกว่าน้ำมันนั้นมีคุณสมบัติตรงข้ามกับน้ำมันเพราะเป็นทรัพยากรที่ไม่มีวันหมด และดูเหมือนจะเพิ่มมากขึ้นเรื่อยๆแต่ถึงแม้มันจะมีจำนวนเพิ่มขึ้นเท่าไรคุณค่าของมันกลับไม่ได้ลดลงเหมือนทรัพยากรทั่วไปแถมสิ่งนี้ไม่ได้มีตัวตนจับต้องได้ล่องลอยไปในอากาศ ขึ้นอยู่กับว่าใครจะใช้ประโยชน์จากมันให้มีประสิทธิภาพที่สุด
ทรัพยากรที่ว่านั้นก็คือ “ข้อมูล” นั่นเอง..
ทุกวันนี้ ไม่ว่าเราจะขับรถไปข้างนอก เล่นอินเทอร์เน็ตอยู่ในบ้าน หรือแม้กระทั่งออกกำลังกาย
ข้อมูลทุกอย่างก็จะถูกนำไปใช้วิเคราะห์พฤติกรรมของเราต่อไป..ในโลกธุรกิจ ถ้าไม่นับธุรกิจประเภทผูกขาดแล้วยังมีบางธุรกิจที่ต่อให้ลูกค้าไม่พอใจในธุรกิจของเรา พวกเขาก็ยังคงใช้บริการของเราอยู่ดีแม้ว่าพวกเขาจะละเมิดความเป็นส่วนตัวแต่เราก็ยังกดไลก์โพสต์บน Facebookเราก็ยังค้นหาของที่อยากได้ใน Google แล้วก็ยอมเจอโฆษณาสินค้าที่เราได้เข้าไปชมต่อไป