ผลต่างระหว่างรุ่นของ "204512-53/lecture4"

จาก Theory Wiki
ไปยังการนำทาง ไปยังการค้นหา
(หน้าที่ถูกสร้างด้วย '{{หัวคำบรรยาย|204512-53}} '''จดบันทึกคำบรรยายโดย:''' :นายกฤตก…')
 
 
(ไม่แสดง 47 รุ่นระหว่างกลางโดยผู้ใช้ 7 คน)
แถว 1: แถว 1:
 
{{หัวคำบรรยาย|204512-53}}
 
{{หัวคำบรรยาย|204512-53}}
 
'''จดบันทึกคำบรรยายโดย:'''  
 
'''จดบันทึกคำบรรยายโดย:'''  
:นายกฤตกรณ์ ศรีวันนา       G5314550024
+
:<table border='0'>
:นายณัฐพล จารุพัฒนะสิริกุล G5314550067
+
<tr><td>นายกฤตกรณ์ ศรีวันนา</td><td>G5314550024</td></tr>
:นายพงศกร สุระธรรม         G5314550130
+
<tr><td>นายณัฐพล จารุพัฒนะสิริกุล</td><td>G5314550067</td></tr>
:นายวุฒิชัย วภักดิ์เพชร       G5314550181
+
<tr><td>นายพงศกร สุระธรรม</td><td>G5314550130</td></tr>
 +
<tr><td>นายวุฒิชัย วภักดิ์เพชร </td><td>G5314550181</td></tr>
 +
</table>
 +
 
 +
 
 +
== Integer Multiplication ==
 +
 
 +
การคูณเลข n x m bits
 +
ให้ X และ  Y เป็นเลข n และ m bits ตามลำดับ
 +
 
 +
ซึ่งสามารถเขียนได้ในรูป  <math> X = A + B </math> และ <math> Y= C + D </math>
 +
 
 +
[[ไฟล์:lec4_integer_x.png]]
 +
 
 +
[[ไฟล์:lec4_integer_y.png]]
 +
 
 +
 
 +
ผลคูณของ  X และ Y สามารถเขียนได้ในรูป
 +
 
 +
<math> X \dot Y = A \cdot C \cdot2^n + (B \cdot C + A \cdot D) 2^m + B \cdot D</math>
 +
 
 +
ซึ่งเขียนเป็น recurrent relation ได้เป็น
 +
 
 +
<math>T(n) = 4T(\frac{n}{2}) + c \cdot n = O(n^2)</math>
 +
 
 +
 
 +
[[ไฟล์:lec4_recurrent_n_div_2.png]]
 +
 
 +
 
 +
จำนวนครั้งของการคูณ คือ AC, BC, AD, BD =>  4 ครั้ง
 +
 
 +
<math>2^n , 2^m</math> เป็นการ shift bit
 +
 
 +
factor 2 ตัวของการแก้ปัญหาด้วยวิธีการ Divide & Conquer คือ
 +
1. จำนวนปัญหาที่แบ่งได้ ปัญหาลดขนาดไปได้แค่ไหน
 +
2. จำนวนปัญหาย่อยที่เกิดขึ้น หลังจากการแบ่งปัญหาใหญ่
 +
 
 +
การทำให้ algorithm นี้เร็วขึ้นได้ด้วยการใช้ Divide & Conquer ทำได้โดย ทำให้ตัวหารเพิ่มขึ้น หรือไม่ก็ทำให้ตัวคูณลดลง
 +
ซึ่งมีวิธีการที่ทำให้การคูณลดเหลือ สามครั้งได้
 +
และ จะทำให้ได้ Recurrent เป็น
 +
 
 +
<math>T(n) = 3T(\frac{n}{2}) + c \cdot n</math>
 +
 
 +
สำหรับ <math>T(n) = 3T(\frac{n}{2}) + c \cdot n</math> ได้ <math> O(n^log_{2}^{3}) = O(n^{1.58})</math>
 +
ซึ่งแย่กว่า Linear แต่ดีกว่า <math> n^2 </math>
 +
 
 +
 
 +
สมมติว่าถ้าทำให้สามารถลดงานได้เป็น n/3 (แต่จำนวนการคูณเท่าเดิม)
 +
<math>
 +
T(n) = 4T(n/3) + cn
 +
=> O(n^{log_{4}3})
 +
</math>
 +
 
 +
 
 +
จำนวนการคูณที่ลดเหลือ 3 ครั้ง ทำให้ลดลงทุกๆ ชั้นของการเรียกตัวเอง ทำให้ <math> O(n^2) => O(n^{1.58}) </math>
 +
เร็วขึ้นประมาณ 1000 เท่า
 +
 
 +
 
 +
==Hashing ==
 +
มี key กับ value  K ∈{0,1,…,M-1}  M มีค่าเยอะมากๆ ปกติแล้วถ้ามีข้อมูล n ตัว จะใช้ array เก็บ n ช่อง หรือ cn ช่อง (เมื่อ c เป็นค่าคงที่) ให้ m เป็นขนาดของ array หรือขนาดของ table  ซึ้ง  m >= n<br />
 +
มี hash function  h ที่รับ k เข้าไปแล้วทำการ map ไป space ของ table(0,1,…,m-1) เมื่อเรารู้ค่า key  เราก็จะรู้ว่าจะไปหาข้อมูลที่ ช่องไหน ถ้าข้อมูลที่แตกต่างกันลงกันคนละช่อง table ก็เปรียบเป็น array นั้นเอง เรื่องที่สนในการทำ Hashing มีสองเรื่องคือ 1. วิธีหรือฟังก์ชันที่ใช้ในการคำนวณหาค่าที่ตำแหน่งที่ใช้เก็บข้อมูล  2. การแก้ปัญหาเมื่อเกิดการชนกันเกิดขึ้น ตัวอย่างการแก้ปัญหาเมื่อเกิดการชนกันคือ การใช้วิธี chaining ในการแก้ปัญหาการชนกันโดยการใช้ link list มาใช้เก็บข้อมูลที่ชนกันตามภาพด้านล้าง  หรือแก้โดยวิธี open addressing คือข้อมูลที่ชนกันจะถูกเก็บลงในช่องถัดไปที่ว่าง ตามภาพด้านล้าง
 +
[[ไฟล์:2553w04_hash01.jpg|center|600px|]]
 +
การวิเคราะห์ปัญหาการใช้ hash สิ่งแรกคือ วิเคราะห์ว่า hash function นั้นดี ซึ่งมีอยู่จริงแต่อาจไม่ดีสำหรับสำหรับทุกๆ input  สำหรับ  hash function ที่ดีนั้นควรจะมีการสุ่มแบบกระจาย สำหรับการวิเคราะห์จะอาศัยการวิเคราะห์ของการทดลองตระกูล Ball and Bin
 +
 
 +
==Ball and Bin ==
 +
มีถัง n ถัง ลูกบอล m ลูก โยนลูกบอลไปสุ่มๆ ลงถังไหนก็ได้ด้วยความน่าจะเป็นที่เท่ากัน สิ่งที่สนใจคือ
 +
*ถังที่มีลูกบอลมากกว่า 1 ลูก
 +
*จำนวนถังว่าง
 +
*จำนวนลูกบอลในถังที่มีจำนวนมากที่สุด
 +
ในการเรียนความน่าจะเป็น หรือการทดลองแบบสุ่มจำเป็นต้องเข้าใจ ศัพท์ต่างๆ ดังนี้  Random experiment คือการทดลองแบบสุ่ม ซึ่งจะได้ผลลัพธ์ออกมาคือ outcome  outcome เป็นสิ่งที่สังเกตได้ ซึ่งในการทดลองแต่ละครั้งก็จะได้ outcome ออกมาหลายๆ อัน เซตของ outcome ทั้งหมดที่เป็นไปได้ เรียกว่า sample space ตามภาพด้านล่าง
 +
[[ไฟล์:2553w04_ball&bin01.jpg|center|400px|]]
 +
ปกติเราไม่ได้สนใจไปที่ outcome โดยแท้จริง เพราะ outcome มีอยู่ได้เยอะแยะ บางครั้งเราสนใจคุณสมบัติบางอย่างของ outcome เช่น<br />
 +
นิยาม experiment ในกรณี ball and bin มีถัง n ถังลูกบอล m ลูก ลูกบอลแต่ละลูกโยนเป็นอิสระต่อกัน ความน่าจะเป็นที่ลูกบอลแต่ละลูกลงถังๆ หนึ่งคือ 1/n<br /> 
 +
จากการทดลองก็จะได้ว่าลูกบอลลูกที่ 1 ลงถังไหน ลูกบอลลูกที่ 2 ลงถังไหน…  ซึ่ง Outcome ของเราขึ้นอยู่กับว่าความสังเกตได้ของเรา เช่นถ้าลูกบอลที่ 1 กับ 5 มีลักษณะเหมือนกัน แยกกันไม่ออก เซตของ outcome ก็จะเปลี่ยนไป sample space ก็จะเปลี่ยนไป แต่ถ้าการทดลองเรื่องเดียวกัน experiment วัดแบบเดียวกัน มันต้องได้ออกมาเหมือนกัน<br />
 +
จากการทดลองเราไม่ได้สนใจที่ outcome โดยแท้จริงแต่เราสนใจคุณสมบัติบางอย่างเช่น<br />
 +
*จำนวนถังที่มีลูกบอลมากว่า 1 ลูก
 +
*จำนวนถังว่าง
 +
*จำนวนลูกบอลในถังที่มากที่สุด
 +
ซึ่งค่าเหล่านี้ถ้าไม่ทดลองจะไม่รู้ค่า เราจะรู้ค่าก็ต่อเมื่อเราทดลองเสร็จแล้วหรือเรามี outcome ออกมาแล้ว ค่าตรงนี้เปลี่ยนแปลงไปตามผลลัพธ์การทดลอง เราจะเรียกค่าตรงนี้หรือผลลัพธ์เหล่านี้ว่า random variable (ตัวแปรสุ่ม) ก็คือตัวแปรที่มีค่าเปลี่ยนแปลงไปตามผลลัพธ์ แต่ในความหมายหนึ่งในเชิงทางการแล้ว random variable เป็นฟังก์ชันจาก sample space ไปอะไรบางอย่าง  Ω → R (มีค่าเป็นจำนวนจริง) เช่นจำนวนถังที่ว่าง ได้ outcome แล้วสามารถบอกได้เลยว่ามีถังว่างกี่อัน ถ้าไม่มี outcome ก็ไม่สามารถบอกได้ว่ามีถังว่างกี่อัน<br />
 +
ก่อนจะวิเคราะห์อะไรได้ เราต้องมีนิยาม experiment ที่ชัดเจนก่อน เราจะทดลองอะไร วัดอะไร ได้ผลลัพธ์เป็นอะไร จากตรงนั้นจะได้ว่า เซตของ outcome ทั้งหมดคือ sample space และจาก outcome เราก็ไปสนใจอีกว่า outcome นั้นมีค่าเป็นเท่าไหร่ นอกจากเราจะสนใจ random variable ธรรมดาแล้ว random variable บางชนิดมีผลลัพธ์เป็นจริง เท็จ เช่น random variable ที่ถามว่ามีลูกบอลลงครบทุกถังหรือไม่ หรือ มีถังไหนไหมที่มีลูกบอลลง 2 ลูก random variable ทีตอบแบบจริงเท็จ มีอีกชื่อหนึ่งคือ event คือเหตุการณ์เพราะฉะนั้นถ้าเราวงๆ เซตของ outcome ที่มันตอบจริง ก็มองตรงนี้ว่าเป็นเหตุการณ์ หรือ event  กล่าวคือ event เป็นซับเซตของ outcome หรือมองอีกแง่หนึ่ง อาจมองเป็นฟังก์ชันก็ได้ ที่รับ outcome ไปแล้วตอบ Yes , No ก็คืออยู่ในซับเซตหรือไม่อยู่ในซับเซต<br />
 +
ในการนิยามความน่าจะเป็น จะมีเทอมอีกตัวหนึ่งคือ P ทีกำหนดค่าให้กับ outcome แต่ละอัน โดยที่ค่าที่กำหนดให้ outcome แต่ละอันจะมีลักษณะเป็นความน่าจะเป็นคือ  ≥  0, ≤ 1 ในการทดลองต้องมี outcome เกิดขึ้นดังนั้นถ้าเรา ∑ ของทุก outcome ก็จะได้ 1 ซึ่งนี้คือความน่าจะเป็นของแต่ละ outcome ซึ่งการนิยามแบบนี้จะเป็นแบบ discrete  ถ้าความน่าจะเป็นที่เป็นแบบ continuous  มันจะนิยามแบบนี้ไม่ได้<br />
 +
พอได้ความน่าจะเป็นแต่ละจุด ก็มองเป็นความน่าจะเป็นของ event ได้ ก็คือความจะเป็นของแต่ละจุดใน event ร่วมกัน<br />
 +
เมื่อเรารวม P (probability function) กับ sample space  ก็จะเรียกว่า probability space  ก็คือผลลัพธ์ทั้งหมดที่เป็นได้พร้อมกับค่าที่ระบุติดกับ outcome แต่ละอัน ที่ค่านี้มีคุณสมบัติบางอย่าง (ความน่าจะเป็นที่ได้ outcome แต่ละอัน) ในการวิเคราะห์ต่อไป หลายๆ ครั้งที่ outcome แต่ละอันมีความน่าจะเป็นที่เท่าๆ กัน คือเป็น uniform distribution  ดังนั้นความน่าจะเป็นของ event ก็จะใช้การนับ แต่บางครั้งความน่าจะเป็นแต่ละอันก็ไม่เท่ากันก็ได้<br />
 +
 
 +
 
 +
'''วิเคราะห์ ในกรณี ball and bin'''<br />
 +
#มี outcome  ที่เป็นไปได้ทั้งหมดกี่ outcome  มี n ถัง ลูกบอลลูกแรกมี n ทางเลือก ลูกบอลลูกที่สองมี n ทางเลือก ดังนั้นลูกบอล m ลูกมีทางเลือก n ทาง ได้ |Ω| = <math>n^m</math>
 +
#ความน่าจะเป็นที่ไม่มีถังไหนเกิดการชนเลย
 +
##กรณี  m > n ความน่าจะเป็นที่เกิดการชนกันคือ 0 
 +
##กรณี  m = n ความน่าจะที่เกิดการชนกันคือ เนื่องจากทุก outcome มีความน่าจะเป็นที่เท่ากัน  ความน่าจะเป็นที่จะได้ outcome ใดๆ คือ 1/<math>n^m</math> ถ้า n = m ความน่าจะเป็นที่ไม่มี collision  ลูกบอลลูกแรกมี n ทางเลือก ลูกที่สองมี n-1 ทางเลือก... ดังนั้น outcome ที่ไม่มี collision คือ n! จาก sample space <math>n^n</math>  ได n!/ <math>n^n</math>  ซึ่งมีค่าน้อยมากๆ กรณี n มีค่ามากขึ้น ซึ่งสามารถแสดงได้ว่า n!/ <math>n^n</math>    ≤ 1/<math>2^{n/2}</math>
 +
#โดยเฉลี่ยแล้วมีถังว่างกี่ถัง  ต้องการหาจำนวนถังว่างซึ่งเป็นตัวแปรสุ่ม ซึ่งจะไม่มีค่าจนกว่าจะได้ทำการทดลอง  แต่เราสามารถพูดถึงคุณสมบัติบางอย่างได้บ้างเหมือนกันแม้ว่าจะไม่ได้ทดลอง  เวลาพูดถึงตัวแปรสุ่มมีคุณสมบัติอย่างหนึ่งที่มีความหมายคือ ค่า Expectation ของมัน (หรืออาจเรียกว่า ค่าเฉลี่ยตัวแปรสุ่ม)<br /> 
 +
::สำหรับตัวแปรสุ่ม x ใดๆ <br />
 +
::<math>E[x] = \sum_{i=-\infty}^\infty i×Pr[x=i]</math><br />
 +
::ในการค่าค่า expectation ของจำนวนถังว่างเมื่อมี n ถังลูกบอล m ลูก จะยากมาก เนื่องจากมันขึ้นต่อกันอยู่ ในการวิเคราะห์ จะใช้คุณสมบัติที่สำคัญของ expectation คือ linearity of expectation คือ<br />
 +
::สำหรับตัวแปรสุ่ม x,y ใดๆ จะขึ้นต่อกันก็ได้ หรือไม่ขึ้นต่อกันก็ได้ เช่นจำนวนถังว่าง กับจำนวนถังที่ไม่ว่าง<br />
 +
::<math>E[x+y]=E[x]+E[y]</math><br />
 +
::วิเคราะห์หาจำนวนถังว่างเมื่อจำนวนถังเท่ากับจำนวนลูกบอล นิยามตัวแปรสุ่ม ให้ ตัวแปรสุ่ม x แทนจำนวนถังว่าง ให้ตัวแปรสุ่ม <math>x_i</math> แทนจำนวนถังว่าง<br />
 +
[[ไฟล์:2553w04_ball&bin02.jpg|center|400px|]]
 +
:4.  ถ้าเราไม่ต้องการให้มีถังว่างจะต้องโยนลูกบอลกี่ลูก ……หมดคาบ <br/>
 +
 
 +
==Multiplie Polynomials ==
 +
Polynomials คือ สมการที่มีตัวแปลเป็นเลขยกกำลัง <math> f_x = a_{i}^n+...+a_{i+m}^{n-c}</math> <br />เช่น <math>f_x = 3x^3y^2+\frac{5x^2}{y}+96x  </math><br/>
 +
ซึ่งสามารถนำมาทำการแก้สมการได้ทั้งการบวก ลบ คูณ หาร ได้แต่เราจะพูดถึงการคูณโพลิโนเมียว
 +
ในการคูณค่าระหว่างกันของตัวแปรโพลิโนเมียวจะเป็นการเพิ่มค่าตัวยกกำลังดังตัวอย่างต่อไปนี้ <br/>
 +
<math>f_{x_1} = x^3y^2+2xy</math> เป็นสมการที่ 1 <br/>
 +
<math>f_{x_2} = x^2y^5+17xy^3</math> เป็นสมการที่ 2 <br/>
 +
เมื่อต้องการ <math>f_{x_3} = f_{x_1} * f_{x_2} </math>จะได้ว่า <br/>
 +
<math> f_{x_3} = (x^3y^2+2xy)*(x^2y^5+17xy^3)</math> <br/>
 +
<math> f_{x_3} = (x^3y^2*(x^2y^5+17xy^3))+(2xy*(x^2y^5+17xy^3))</math> <br/>
 +
<math> f_{x_3} = (x^3y^2*x^2y^5)+(x^3y^2*17xy^3)+(2xy*x^2y^5)+(2xy*17xy^3)</math> <br/>
 +
<math> f_{x_3} = (x^{3+2}y^{2+5})+(17x^{3+1}y^{2+3})+(2x^{1+2}y^{1+5})+((2*17)x^{1+1}y^{1+3})</math> <br/>
 +
<math> f_{x_3} = (x^{5}y^{7})+(17x^{4}y^{5})+(2x^{3}y^{6})+(34x^{2}y^{4})</math> <br/>
 +
<br/>
 +
'''Multiplies Polynomials Animation Simple : '''<br/>
 +
[[สื่อ:http://www.calculusinmotion.com/DEMO-factor_squares/factor_squares.html]]
 +
[http://www.calculusinmotion.com/DEMO-factor_squares/factor_squares.html]
 +
<br/>
 +
[[ไฟล์:SMPoli.JPG]]
 +
<br/>
 +
ภาพจาก http://www.calculusinmotion.com <br/>
 +
 
 +
== Fast Fourier transform (FFT) ==
 +
คือ Algorithm ที่ใช้สำหรับหาผลคูณของสมการ Polynomial Degree-d เช่นผลคูณของสมการ Polynomial Degree เท่ากับ 2 <br/><br/>
 +
<math>(1+2x+3x^2)*(2+x+4x^2)= 2+5x+12x^2+11x^3+12x^4 </math> <br/><br/>
 +
ถ้า <math> A(x)=a_{0}+a_{1x}+...+a_{dx}^d </math> และ <math> B(x)=b_0+b_{1x}+...+b_{dx}^d </math><br/><br/>
 +
จะได้ผลคูณเท่ากับ <math> C(x) = A(x)*B(x)= c_{0}+c_{1x}+...+c_{2d}x^{2d} </math> 
 +
ซึ่งจะหาค่า coefficients <math> c_{k} </math> ได้จาก<br/><br/>
 +
<math> c_k=a_0b_k+a_1b_{k-1}+...+a_kb_0 = \sum_{i=0}^k a_ib_{k-i} </math> <br/><br/>

รุ่นแก้ไขปัจจุบันเมื่อ 10:52, 7 ตุลาคม 2553

บันทึกคำบรรยายวิชา 204512-53 นี้ เป็นบันทึกที่นิสิตเขียนขึ้น เนื้อหาโดยมากยังไม่ผ่านการตรวจสอบอย่างละเอียด การนำไปใช้ควรระมัดระวัง

จดบันทึกคำบรรยายโดย:

นายกฤตกรณ์ ศรีวันนาG5314550024
นายณัฐพล จารุพัฒนะสิริกุลG5314550067
นายพงศกร สุระธรรมG5314550130
นายวุฒิชัย วภักดิ์เพชร G5314550181


Integer Multiplication

การคูณเลข n x m bits ให้ X และ Y เป็นเลข n และ m bits ตามลำดับ

ซึ่งสามารถเขียนได้ในรูป และ

Lec4 integer x.png

Lec4 integer y.png


ผลคูณของ X และ Y สามารถเขียนได้ในรูป

ซึ่งเขียนเป็น recurrent relation ได้เป็น


Lec4 recurrent n div 2.png


จำนวนครั้งของการคูณ คือ AC, BC, AD, BD => 4 ครั้ง

เป็นการ shift bit

factor 2 ตัวของการแก้ปัญหาด้วยวิธีการ Divide & Conquer คือ 1. จำนวนปัญหาที่แบ่งได้ ปัญหาลดขนาดไปได้แค่ไหน 2. จำนวนปัญหาย่อยที่เกิดขึ้น หลังจากการแบ่งปัญหาใหญ่

การทำให้ algorithm นี้เร็วขึ้นได้ด้วยการใช้ Divide & Conquer ทำได้โดย ทำให้ตัวหารเพิ่มขึ้น หรือไม่ก็ทำให้ตัวคูณลดลง ซึ่งมีวิธีการที่ทำให้การคูณลดเหลือ สามครั้งได้ และ จะทำให้ได้ Recurrent เป็น

สำหรับ ได้ ซึ่งแย่กว่า Linear แต่ดีกว่า


สมมติว่าถ้าทำให้สามารถลดงานได้เป็น n/3 (แต่จำนวนการคูณเท่าเดิม)


จำนวนการคูณที่ลดเหลือ 3 ครั้ง ทำให้ลดลงทุกๆ ชั้นของการเรียกตัวเอง ทำให้ เร็วขึ้นประมาณ 1000 เท่า


Hashing

มี key กับ value K ∈{0,1,…,M-1} M มีค่าเยอะมากๆ ปกติแล้วถ้ามีข้อมูล n ตัว จะใช้ array เก็บ n ช่อง หรือ cn ช่อง (เมื่อ c เป็นค่าคงที่) ให้ m เป็นขนาดของ array หรือขนาดของ table ซึ้ง m >= n
มี hash function h ที่รับ k เข้าไปแล้วทำการ map ไป space ของ table(0,1,…,m-1) เมื่อเรารู้ค่า key เราก็จะรู้ว่าจะไปหาข้อมูลที่ ช่องไหน ถ้าข้อมูลที่แตกต่างกันลงกันคนละช่อง table ก็เปรียบเป็น array นั้นเอง เรื่องที่สนในการทำ Hashing มีสองเรื่องคือ 1. วิธีหรือฟังก์ชันที่ใช้ในการคำนวณหาค่าที่ตำแหน่งที่ใช้เก็บข้อมูล 2. การแก้ปัญหาเมื่อเกิดการชนกันเกิดขึ้น ตัวอย่างการแก้ปัญหาเมื่อเกิดการชนกันคือ การใช้วิธี chaining ในการแก้ปัญหาการชนกันโดยการใช้ link list มาใช้เก็บข้อมูลที่ชนกันตามภาพด้านล้าง หรือแก้โดยวิธี open addressing คือข้อมูลที่ชนกันจะถูกเก็บลงในช่องถัดไปที่ว่าง ตามภาพด้านล้าง

2553w04 hash01.jpg

การวิเคราะห์ปัญหาการใช้ hash สิ่งแรกคือ วิเคราะห์ว่า hash function นั้นดี ซึ่งมีอยู่จริงแต่อาจไม่ดีสำหรับสำหรับทุกๆ input สำหรับ hash function ที่ดีนั้นควรจะมีการสุ่มแบบกระจาย สำหรับการวิเคราะห์จะอาศัยการวิเคราะห์ของการทดลองตระกูล Ball and Bin

Ball and Bin

มีถัง n ถัง ลูกบอล m ลูก โยนลูกบอลไปสุ่มๆ ลงถังไหนก็ได้ด้วยความน่าจะเป็นที่เท่ากัน สิ่งที่สนใจคือ

  • ถังที่มีลูกบอลมากกว่า 1 ลูก
  • จำนวนถังว่าง
  • จำนวนลูกบอลในถังที่มีจำนวนมากที่สุด

ในการเรียนความน่าจะเป็น หรือการทดลองแบบสุ่มจำเป็นต้องเข้าใจ ศัพท์ต่างๆ ดังนี้ Random experiment คือการทดลองแบบสุ่ม ซึ่งจะได้ผลลัพธ์ออกมาคือ outcome outcome เป็นสิ่งที่สังเกตได้ ซึ่งในการทดลองแต่ละครั้งก็จะได้ outcome ออกมาหลายๆ อัน เซตของ outcome ทั้งหมดที่เป็นไปได้ เรียกว่า sample space ตามภาพด้านล่าง

2553w04 ball&bin01.jpg

ปกติเราไม่ได้สนใจไปที่ outcome โดยแท้จริง เพราะ outcome มีอยู่ได้เยอะแยะ บางครั้งเราสนใจคุณสมบัติบางอย่างของ outcome เช่น
นิยาม experiment ในกรณี ball and bin มีถัง n ถังลูกบอล m ลูก ลูกบอลแต่ละลูกโยนเป็นอิสระต่อกัน ความน่าจะเป็นที่ลูกบอลแต่ละลูกลงถังๆ หนึ่งคือ 1/n
จากการทดลองก็จะได้ว่าลูกบอลลูกที่ 1 ลงถังไหน ลูกบอลลูกที่ 2 ลงถังไหน… ซึ่ง Outcome ของเราขึ้นอยู่กับว่าความสังเกตได้ของเรา เช่นถ้าลูกบอลที่ 1 กับ 5 มีลักษณะเหมือนกัน แยกกันไม่ออก เซตของ outcome ก็จะเปลี่ยนไป sample space ก็จะเปลี่ยนไป แต่ถ้าการทดลองเรื่องเดียวกัน experiment วัดแบบเดียวกัน มันต้องได้ออกมาเหมือนกัน
จากการทดลองเราไม่ได้สนใจที่ outcome โดยแท้จริงแต่เราสนใจคุณสมบัติบางอย่างเช่น

  • จำนวนถังที่มีลูกบอลมากว่า 1 ลูก
  • จำนวนถังว่าง
  • จำนวนลูกบอลในถังที่มากที่สุด

ซึ่งค่าเหล่านี้ถ้าไม่ทดลองจะไม่รู้ค่า เราจะรู้ค่าก็ต่อเมื่อเราทดลองเสร็จแล้วหรือเรามี outcome ออกมาแล้ว ค่าตรงนี้เปลี่ยนแปลงไปตามผลลัพธ์การทดลอง เราจะเรียกค่าตรงนี้หรือผลลัพธ์เหล่านี้ว่า random variable (ตัวแปรสุ่ม) ก็คือตัวแปรที่มีค่าเปลี่ยนแปลงไปตามผลลัพธ์ แต่ในความหมายหนึ่งในเชิงทางการแล้ว random variable เป็นฟังก์ชันจาก sample space ไปอะไรบางอย่าง Ω → R (มีค่าเป็นจำนวนจริง) เช่นจำนวนถังที่ว่าง ได้ outcome แล้วสามารถบอกได้เลยว่ามีถังว่างกี่อัน ถ้าไม่มี outcome ก็ไม่สามารถบอกได้ว่ามีถังว่างกี่อัน
ก่อนจะวิเคราะห์อะไรได้ เราต้องมีนิยาม experiment ที่ชัดเจนก่อน เราจะทดลองอะไร วัดอะไร ได้ผลลัพธ์เป็นอะไร จากตรงนั้นจะได้ว่า เซตของ outcome ทั้งหมดคือ sample space และจาก outcome เราก็ไปสนใจอีกว่า outcome นั้นมีค่าเป็นเท่าไหร่ นอกจากเราจะสนใจ random variable ธรรมดาแล้ว random variable บางชนิดมีผลลัพธ์เป็นจริง เท็จ เช่น random variable ที่ถามว่ามีลูกบอลลงครบทุกถังหรือไม่ หรือ มีถังไหนไหมที่มีลูกบอลลง 2 ลูก random variable ทีตอบแบบจริงเท็จ มีอีกชื่อหนึ่งคือ event คือเหตุการณ์เพราะฉะนั้นถ้าเราวงๆ เซตของ outcome ที่มันตอบจริง ก็มองตรงนี้ว่าเป็นเหตุการณ์ หรือ event กล่าวคือ event เป็นซับเซตของ outcome หรือมองอีกแง่หนึ่ง อาจมองเป็นฟังก์ชันก็ได้ ที่รับ outcome ไปแล้วตอบ Yes , No ก็คืออยู่ในซับเซตหรือไม่อยู่ในซับเซต
ในการนิยามความน่าจะเป็น จะมีเทอมอีกตัวหนึ่งคือ P ทีกำหนดค่าให้กับ outcome แต่ละอัน โดยที่ค่าที่กำหนดให้ outcome แต่ละอันจะมีลักษณะเป็นความน่าจะเป็นคือ ≥ 0, ≤ 1 ในการทดลองต้องมี outcome เกิดขึ้นดังนั้นถ้าเรา ∑ ของทุก outcome ก็จะได้ 1 ซึ่งนี้คือความน่าจะเป็นของแต่ละ outcome ซึ่งการนิยามแบบนี้จะเป็นแบบ discrete ถ้าความน่าจะเป็นที่เป็นแบบ continuous มันจะนิยามแบบนี้ไม่ได้
พอได้ความน่าจะเป็นแต่ละจุด ก็มองเป็นความน่าจะเป็นของ event ได้ ก็คือความจะเป็นของแต่ละจุดใน event ร่วมกัน
เมื่อเรารวม P (probability function) กับ sample space ก็จะเรียกว่า probability space ก็คือผลลัพธ์ทั้งหมดที่เป็นได้พร้อมกับค่าที่ระบุติดกับ outcome แต่ละอัน ที่ค่านี้มีคุณสมบัติบางอย่าง (ความน่าจะเป็นที่ได้ outcome แต่ละอัน) ในการวิเคราะห์ต่อไป หลายๆ ครั้งที่ outcome แต่ละอันมีความน่าจะเป็นที่เท่าๆ กัน คือเป็น uniform distribution ดังนั้นความน่าจะเป็นของ event ก็จะใช้การนับ แต่บางครั้งความน่าจะเป็นแต่ละอันก็ไม่เท่ากันก็ได้


วิเคราะห์ ในกรณี ball and bin

  1. มี outcome ที่เป็นไปได้ทั้งหมดกี่ outcome มี n ถัง ลูกบอลลูกแรกมี n ทางเลือก ลูกบอลลูกที่สองมี n ทางเลือก ดังนั้นลูกบอล m ลูกมีทางเลือก n ทาง ได้ |Ω| =
  2. ความน่าจะเป็นที่ไม่มีถังไหนเกิดการชนเลย
    1. กรณี m > n ความน่าจะเป็นที่เกิดการชนกันคือ 0
    2. กรณี m = n ความน่าจะที่เกิดการชนกันคือ เนื่องจากทุก outcome มีความน่าจะเป็นที่เท่ากัน ความน่าจะเป็นที่จะได้ outcome ใดๆ คือ 1/ ถ้า n = m ความน่าจะเป็นที่ไม่มี collision ลูกบอลลูกแรกมี n ทางเลือก ลูกที่สองมี n-1 ทางเลือก... ดังนั้น outcome ที่ไม่มี collision คือ n! จาก sample space ได n!/ ซึ่งมีค่าน้อยมากๆ กรณี n มีค่ามากขึ้น ซึ่งสามารถแสดงได้ว่า n!/ ≤ 1/
  3. โดยเฉลี่ยแล้วมีถังว่างกี่ถัง ต้องการหาจำนวนถังว่างซึ่งเป็นตัวแปรสุ่ม ซึ่งจะไม่มีค่าจนกว่าจะได้ทำการทดลอง แต่เราสามารถพูดถึงคุณสมบัติบางอย่างได้บ้างเหมือนกันแม้ว่าจะไม่ได้ทดลอง เวลาพูดถึงตัวแปรสุ่มมีคุณสมบัติอย่างหนึ่งที่มีความหมายคือ ค่า Expectation ของมัน (หรืออาจเรียกว่า ค่าเฉลี่ยตัวแปรสุ่ม)
สำหรับตัวแปรสุ่ม x ใดๆ

ในการค่าค่า expectation ของจำนวนถังว่างเมื่อมี n ถังลูกบอล m ลูก จะยากมาก เนื่องจากมันขึ้นต่อกันอยู่ ในการวิเคราะห์ จะใช้คุณสมบัติที่สำคัญของ expectation คือ linearity of expectation คือ
สำหรับตัวแปรสุ่ม x,y ใดๆ จะขึ้นต่อกันก็ได้ หรือไม่ขึ้นต่อกันก็ได้ เช่นจำนวนถังว่าง กับจำนวนถังที่ไม่ว่าง

วิเคราะห์หาจำนวนถังว่างเมื่อจำนวนถังเท่ากับจำนวนลูกบอล นิยามตัวแปรสุ่ม ให้ ตัวแปรสุ่ม x แทนจำนวนถังว่าง ให้ตัวแปรสุ่ม แทนจำนวนถังว่าง
2553w04 ball&bin02.jpg
4. ถ้าเราไม่ต้องการให้มีถังว่างจะต้องโยนลูกบอลกี่ลูก ……หมดคาบ

Multiplie Polynomials

Polynomials คือ สมการที่มีตัวแปลเป็นเลขยกกำลัง
เช่น
ซึ่งสามารถนำมาทำการแก้สมการได้ทั้งการบวก ลบ คูณ หาร ได้แต่เราจะพูดถึงการคูณโพลิโนเมียว ในการคูณค่าระหว่างกันของตัวแปรโพลิโนเมียวจะเป็นการเพิ่มค่าตัวยกกำลังดังตัวอย่างต่อไปนี้
เป็นสมการที่ 1
เป็นสมการที่ 2
เมื่อต้องการ จะได้ว่า






Multiplies Polynomials Animation Simple :
สื่อ:http://www.calculusinmotion.com/DEMO-factor_squares/factor_squares.html [1]
SMPoli.JPG
ภาพจาก http://www.calculusinmotion.com

Fast Fourier transform (FFT)

คือ Algorithm ที่ใช้สำหรับหาผลคูณของสมการ Polynomial Degree-d เช่นผลคูณของสมการ Polynomial Degree เท่ากับ 2



ถ้า และ

จะได้ผลคูณเท่ากับ ซึ่งจะหาค่า coefficients ได้จาก