පිහිටුවීමද්විතීයික අධ්යාපනය හා පාසල්

ලඟම අසල්වැසියාට ක්රමය: වැඩ උදාහරණයක්

ළඟම ඇති අසල්වැසියා ක්රමය වෙනස් වස්තූන් අතර සමානකම ඇගයීම මත පදනම් වූ පහසුම මෙට්රික් classifier වේ.

විශ්ලේෂණය වස්තුව ඔවුන් පුහුණු කීරීම විෂයන් අයත් වන පන්තියට අයත්. අපට ළඟම අසල්වැසියා වන හොයලා බලමු. විවිධ තාක්ෂණික ක්රම පිළිබඳ සංකීර්ණ කාරණය, උදාහරණ තේරුම් ගන්න උත්සාහ කරන්න.

කල්පිතය ක්රමය

ලඟම අසල්වැසියාට ක්රමය වර්ගීකරණයට වඩාත් බහුලව භාවිතා වන ඇල්ගොරිතම ලෙස සැලකිය හැකිය. වර්ගීකරණය ලබන වස්තුවක් x_i නියැදි ඉගෙන සමීපතම වස්තුව කරන අතර, පන්ති y_i අයත් වේ.

අසල්වැසියන් ළඟම ක්රම නිශ්චිතභාවයකින්

ලඟම අසල්වැසියාට ක්රමය k වර්ගීකරණය නිරවද්යතාව වැඩි දියුණු කළ හැක. විශ්ලේෂණය වස්තුව තම අසල්වැසියන් රොත්ත ලෙස එම පන්තියට අයත් බව ඊට ආසන්න k විසින් විශ්ලේෂණය නියැදි x_i වස්තු වේ. අසල්වැසියන් සංඛ්යාව සමාන විවිධ පන්ති අයිති නම් අසල්වැසියන් සංඛ්යාව පන්ති දෙක සමග ගැටලු විසඳීමට, අවුල් සහගත තත්වයක් වළක්වා ගැනීමට අමුතු වනු ඇත.

වැඩ තහනම් අසල්වැසියන් තාක්ෂණයට

Postgresql විශ්ලේෂණය ක්රමය tsvector ළඟම අසල්වාසීන් පන්ති සංඛ්යාව අවම වශයෙන් තුනක් විට භාවිතා වන අතර, ඔබ ඔත්තේ සංඛ්යාවක් භාවිත කළ නොහැක. එහෙත් අවුල් සහගත පවා එවැනි අවස්ථාවන්හි දී පැන නඟිනවා. එවිට, i වැනි අසල්වැසි මම අසල්වැසියා නිලය සමඟ අඩු වන w_i බර, ලැබෙන. එය සමීප අසල්වැසියන් අතර උපරිම මුළු බර ඇති, වස්තුව පන්ති සඳහන් කරයි.

compactness යන කල්පිතය

ඉහත ක්රම සියලු හදවත compactness යන කල්පිතය වේ. මෙය වස්තූන් අතර සමානකම සහ එම පන්තිය ඔවුන්ගේ අයත්, එම පියවර අතර සම්බන්ධයක් ඇති බවයි. මෙම තත්වය තුල, විවිධ වර්ග අතර මායිම් සරල ආකාරයක, සහ අවකාශය සංයුක්ත ජංගම ප්රදේශයේ වස්තු පන්ති නිර්මාණය කරන්න. සංවෘත, උතුරින් කට්ටලයක් අදහස් ගෙන ගණිතමය විශ්ලේෂණය වැනි ප්රදේශ යටතේ. මෙම කල්පිතය යන වචන එදිනෙදා හැඟීම සම්බන්ධ නොවේ.

මූලික සූත්රය

අපට තව ළඟම අසල්වැසියා දැන් අපි සලකා බලමු. යෝජිත පුහුණු නියැදි වර්ගය "වස්තුව-පිළිතුරු» X ^ මීටර් = \ නම් {(x_1, y_1), \ තිත්, (x_m, y_m) \}; දුර කාර්යය \ රෝ අක්ෂරය (x, x ') අර්ථ දැක්වීමට වස්තූන් බහුත්වයක් නම් එම ශ්රිතයේ අගය වැඩි කිරීම මගින් වස්තු සමාන ප්රමාණවත් ආකෘතිය ස්වරූපයෙන් නියෝජනය කරන, x, x වස්තූන් අතර සමාන අඩු.

ඕනෑම වස්තුවක් ලෙස, ඔබ පුහුණු ආදර්ශ ඔබ දුර වැඩි සමග x_i විරුද්ධ ඉදි වනු ඇත:

\ Rho (u, x_ {1; u}) \ leq \ රෝ අක්ෂරය (u, x_ {2; u}) \ leq \ cdots \ leq \ රෝ අක්ෂරය (u, x_ {මීටර්; u}),

එහිදී x_ {i; ඔබ} අසල්වැසියා වස්තුවේ i වැනි වන ඔබ වස්තුව ඉගෙනුම් ආදර්ශ, ගති ලක්ෂණ. එවැනි අංකනය 'හා i වැනි අසල්වැසි පිළිතුරු දීමට භාවිතා කරන්න: y_ {i; ඔබ}. එහි ප්රතිඵලයක් ලෙස, අපි ඕනෑම වස්තුවක් ඔබ ම නියැදි නැවත අංකනය සිදුවීමක් බව.

අසල්වැසියන් සංඛ්යාව k තීරණය කිරීම

ලඟම අසල්වැසියාට ක්රමය k = 1 වස්තූන්-විමෝචනය මත පමණක් නොව, නුදුරු බව ෙවනත් පංතිවල සඳහා, වැරදි වර්ගීකරණය ලබා සමත් වූ විට.

අපි k = මීටර් ගත වේ නම්, මෙම ඇල්ගොරිතමය ලෙස ස්ථාවර වනු ඇති අතර, නියත වටිනාකමින් පිරිහුණු ඇත. විශ්වසනීයත්වය k අන්ත දර්ශක වීම වැදගත් වන්නේ ඒ නිසයි.

ප්රායෝගිකව, පාලනය ලිස්සා ප්රශස්ත දර්ශකය k භාවිතා නිර්ණායකය ලෙස.

චිත්රපට ප්රදර්ශනය විමෝචනය

අධ්යයන වස්තූන් විශාල වශයෙන් අසමාන වේ, නමුත් ඔවුන් අතර පන්තියේ ලක්ෂණ, සහ ප්රමිතීන් ලෙස සඳහන් කරන අය වේ. මෙම පන්තිය අයත් එහි ඉහළ සම්භාවිතාව පිළිබඳ කදිම ආදර්ශ විෂය ආසන්නයේ දී.

කොහොමද rezultativen ළඟම අසල්වාසීන් ක්රමය? උදාහරණයක් වස්තු පර්යන්ත හා රාජ්ය නොවන තොරතුරු ප්රවර්ග පදනම මත දැක ගත හැකි විය. මෙම පන්තියේ අනෙකුත් නියෝජිතයන් වස්තුවක ඝන පරිසරය උපකල්පනය කර ඇත. ඔබ නියැදීමෙන් ගුණාත්මක දුක් විඳින්නේ නැත වර්ගීකරණය සිට ඒවා ඉවත් විට.

"බිම" බව ශබ්ද පමණක් ලබාගෙන ඇත පන්ති සාම්පල සංඛ්යාවක් බවට ලබා ගන්න. වර්ගීකරණය ගුණාත්මකභාවය මත සැලකිය යුතු ධනාත්මක බලපෑමක් ඉවත් කිරීම.

මෙම සාම්පල uninformative ගෙන සහ ශබ්දය වස්තූන් තුරන් නම්, ඔබ එම අවස්ථාවේ දී ධනාත්මක ප්රතිඵල කිහිපයක් මත ගණන් කළ හැක.

පළමු වන අන්තර්නිවේෂණය ක්රමය ළඟම අසල්වැසියා වර්ගීකරණය, ගුණාත්මක භාවය වැඩි දියුණු කිරීම සඳහා ගබඩා කර දත්ත ප්රමාණය අඩු කිරීම, වර්ගීකරණය කාලය අඩු, ඊළඟ ප්රමිතීන් තේරීම සඳහා වැය වන ඉඩ දෙයි.

අති-විශාල සාම්පල භාවිතය

ලඟම අසල්වැසියාට ක්රමය ඉගෙනුම් වස්තූන් සැබෑ ගබඩා මත පදනම් වේ. තාක්ෂණික දෝෂයක් භාවිතා ඉතා විශාල පරිමාණයේ සාම්පල නිර්මාණය කරන්න. අරමුණ, තොරතුරු සැලකිය යුතු ප්රමාණයක් බේරා ගැනීමට පමණක් නොව, කාලය අවම ප්රමාණය ඔබ සමීපතම අසල්වැසියන් අතර k ඕනෑම වස්තුවක් සොයා ගැනීමට කාලය ඇති කිරීමට පමණක් නොවේ.

මෙම කාර්යය සාර්ථකව මුහුණ දීම සඳහා, ක්රම දෙකක් භාවිතා වේ:

  • ශ්රාවයක් දත්ත නොවන වස්තූන් හරහා ආදර්ශ පරමාණ;
  • ඵලදායී ළඟම අසල්වාසීන් ක්ෂණිකව සෙවීම සඳහා විශේෂ දත්ත ව්යුහය සහ කේත භාවිතා කරන්න.

තෝරා ක්රම නීති

ඉහත වර්ගීකරණය ලෙස සලකන ලදී. ලඟම අසල්වැසියාට ක්රමය කල්තියා ඇති දුර කාර්යය \ රෝ අක්ෂරය (x, x ') හඳුනන ප්රායෝගික ගැටලු, විසඳීමේ භාවිතා වේ. වස්තූන් විස්තර සංඛ්යාත්මක වාහකයන් වූ යුක්ලීඩ් මෙට්රික් භාවිතා කරන්න. මෙම තේරීම විශේෂ යුක්තිසහගත ඇත, නමුත් සියලුම සංඥා පිළිබඳ මිනුම් ඇතුළත් "එකම පරිමාණ." මෙම සාධකය සැලකිල්ලට ගෙන නැති නම්, එසේ නම් මෙට්රික් වැඩිම සංඛ්යාත්මක අගයන් සහිත විශේෂාංගයක් රජයන ඇත.

විශේෂාංග සැලකිය යුතු මුදලක් තිබේ නම්, විශේෂ රෝග ලක්ෂණ මත අපගමනය එකතුව ලෙස දුර ගණනය බරපතල ගැටලුවක් මානයක් පෙනී යයි.

එකිනෙකාට සියලු වස්තු ඇත සිට ඈත ඉහළ මාන අවකාශය. අවසානයේ, ඕනෑම නියැදි k අසල්වැසියන් අධ්යයනය කරනු ලබන වස්තුව ලබන වනු ඇත. මෙම ගැටලුව තුරන් කිරීම සඳහා තොරතුරු ලක්ෂණ ඉතා සුළු ප්රමාණයක් තෝරාගෙන ඇත. ඇස්තමේන්තු ගණනය කිරීම සඳහා ඇල්ගොරිතම වල සංඥා වෙනස් වූ පදනම මත ගොඩනැගීම සිදු කරයි නම්, එක් එක් පුද්ගලයාට තම සමීපත්වය කාර්යය ගොඩනැගීම සඳහා.

නිගමනය

ගණිතමය ගණනය කිරීම් බොහෝ විට ඔවුන්ගේ ම ආවේණික ලක්ෂණ, වාසි සහ අවාසි ඇති බව විවිධාකාර ක්රමවේදයන් භාවිතය සම්බන්ධ වේ. බලපු ළඟම අසල්වැසියා ක්රමය ගණිතමය වස්තූන් ලක්ෂණ නිසා ඉතා බරපතල ගැටලුවක් විසඳීමට හැක. විශ්ලේෂණය ක්රමය මත පදනම් වූ පරීක්ෂණ සංකල්පය, ක්රියාකාරීව කෘතිම බුද්ධි භාවිතා වේ.

මෙම විෙශේෂඥ පද්ධති එය වස්තූන් වර්ගීකරණය, පමණක් නොව, පරිශීලක ප්රශ්නයට වර්ගීකරණය පැහැදිලි කිරීමක් පෙන්වන්න පමණක් නොව අවශ්ය වේ. මෙම ක්රමය, මෙම සංසිද්ධිය පැහැදිලි කිරීමක් යම් පන්තියේ වස්තුව මෙන්ම එහි පිහිටීම භාවිතා කරන ආදර්ශ සාපේක්ෂව සම්බන්ධයෙන් ප්රකාශ කරනු ලැබේ. නීතිමය ක්ෂේත්රයේ විශේෂඥයින්, භු, වෛද්යවරුන්, ක්රියාකාරීව තම පර්යේෂණ එය භාවිතා මෙම "පූර්වාදර්ශයක්" තර්ක කරනවා.

ද විශ්ලේෂණය වස්තූන් අතර වායු විමෝචන වළක්වා ඇති අතර ක්රමය අපේක්ෂිත ප්රතිඵල ලබා දීම, කාර්යක්ෂම වඩාත් විශ්වසනීය වූ අතර, විශ්ලේෂණය කළ යුතු නම්, ඔබ, අවම වශයෙන් අගය k ගත යුතුය. ඒ ප්රමිති ඇයි භාවිතය හා තේරීම් ක්රමය මෙන්ම, ප්රශස්තිකරණය ප්රමිතික වේ.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 si.atomiyme.com. Theme powered by WordPress.