Избирање засновано на наградa

Од testwiki
Преработка од 01:02, 21 јануари 2023; направена од imported>Dandarmkd
(разл) ← Претходна преработка | Последна преработка (разл) | Следна преработка → (разл)
Прејди на прегледникот Прејди на пребарувањето

Избирање засновано на наградa ― техника која се користи во еволутивните алгоритми за избор на потенцијално корисни решенија за прекомбинација. Веројатноста да биде избран за поединец е пропорционална на кумулативната награда, добиена од поединецот. Кумулативната награда може да се пресмета како збир на поединечната награда и наградата наследена од родителите.

Опис

Избирањето засновано на наградa може да биде користено во рамката за разбојник со повеќе оружје за оптимизација со повеќе цели за да се добие подобра приближност на Паретовата ефикасност.[1]

Новороденчето a'(g+1) а неговите родители добиваат награда r(g), ако a'(g+1) било избрано за ново население Q(g+1), во спротивно наградата е нула. Можни се неколку дефиниции за награди:

  • 1. r(g)=1, ако новороденото лице a'(g+1) било избран за ново население Q(g+1) .
  • 2. r(g)=1rank(a'(g+1))μ if a'(g+1)Q(g+1), каде rank(a'(g+1)) е ранг на нововметната единка во населението на μ поединци. Рангирањето може да се пресмета со користење на добро позната постапка за непреовладувачко редење.[2]
  • 3. r(g)=aQ(g+1)ΔH(a,Q(g+1))aQ(g)ΔH(a,Q(g)), каде ΔH(a,Q(g)) е хиперволумен показател за придонес на поединецот a на населението Q(g) . Наградата r(g)>0 доколку нововнесената единка го подобрува квалитетот на населението, што се мери како нејзин хиперволумен придонес во објективниот простор.
  • 4. Олеснување на горенаведената награда, што вклучува казна заснована на ранг за поени за k преовладувачката Паретова ефикаснот: r(g)=12k1(ndomk(Q(g+1))ΔH(a,ndomk(Q(g+1)))ndomk(Q(g))ΔH(a,ndomk(Q(g))))

Изборот заснован на награди може брзо да ги идентификува најплодните насоки на пребарување со максимизирање на кумулативната награда на поединците.

Поврзано

Наводи

Предлошка:Наводи