{"id":"https://openalex.org/W6967109275","doi":"https://doi.org/10.48550/arxiv.2405.03711","title":"Guidance Design for Escape Flight Vehicle Using Evolution Strategy Enhanced Deep Reinforcement Learning","display_name":"Guidance Design for Escape Flight Vehicle Using Evolution Strategy Enhanced Deep Reinforcement Learning","publication_year":2024,"publication_date":"2024-05-04","ids":{"openalex":"https://openalex.org/W6967109275","doi":"https://doi.org/10.48550/arxiv.2405.03711"},"language":"en","primary_location":{"id":"doi:10.48550/arxiv.2405.03711","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2405.03711","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article-journal"},"type":"preprint","indexed_in":["datacite"],"open_access":{"is_oa":true,"oa_status":"green","oa_url":"https://doi.org/10.48550/arxiv.2405.03711","any_repository_has_fulltext":true},"authorships":[{"author_position":"first","author":{"id":null,"display_name":"Hu, Xiao","orcid":null},"institutions":[],"countries":[],"is_corresponding":true,"raw_author_name":"Hu, Xiao","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":null,"display_name":"Wang, Tianshu","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Wang, Tianshu","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"middle","author":{"id":null,"display_name":"Gong, Min","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Gong, Min","raw_affiliation_strings":[],"affiliations":[]},{"author_position":"last","author":{"id":null,"display_name":"Yang, Shaoshi","orcid":null},"institutions":[],"countries":[],"is_corresponding":false,"raw_author_name":"Yang, Shaoshi","raw_affiliation_strings":[],"affiliations":[]}],"institutions":[],"countries_distinct_count":0,"institutions_distinct_count":4,"corresponding_author_ids":[],"corresponding_institution_ids":[],"apc_list":null,"apc_paid":null,"fwci":null,"has_fulltext":false,"cited_by_count":0,"citation_normalized_percentile":null,"cited_by_percentile_year":null,"biblio":{"volume":null,"issue":null,"first_page":null,"last_page":null},"is_retracted":false,"is_paratext":false,"is_xpac":true,"primary_topic":{"id":"https://openalex.org/T12158","display_name":"Guidance and Control Systems","score":0.9463000297546387,"subfield":{"id":"https://openalex.org/subfields/2202","display_name":"Aerospace Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},"topics":[{"id":"https://openalex.org/T12158","display_name":"Guidance and Control Systems","score":0.9463000297546387,"subfield":{"id":"https://openalex.org/subfields/2202","display_name":"Aerospace Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T11082","display_name":"Spacecraft Dynamics and Control","score":0.0430000014603138,"subfield":{"id":"https://openalex.org/subfields/2202","display_name":"Aerospace Engineering"},"field":{"id":"https://openalex.org/fields/22","display_name":"Engineering"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}},{"id":"https://openalex.org/T12794","display_name":"Adaptive Dynamic Programming Control","score":0.00139999995008111,"subfield":{"id":"https://openalex.org/subfields/1703","display_name":"Computational Theory and Mathematics"},"field":{"id":"https://openalex.org/fields/17","display_name":"Computer Science"},"domain":{"id":"https://openalex.org/domains/3","display_name":"Physical Sciences"}}],"keywords":[{"id":"https://openalex.org/keywords/reinforcement-learning","display_name":"Reinforcement learning","score":0.6477000117301941},{"id":"https://openalex.org/keywords/residual","display_name":"Residual","score":0.5080999732017517},{"id":"https://openalex.org/keywords/constraint","display_name":"Constraint (computer-aided design)","score":0.4717000126838684},{"id":"https://openalex.org/keywords/artificial-neural-network","display_name":"Artificial neural network","score":0.45579999685287476},{"id":"https://openalex.org/keywords/control-theory","display_name":"Control theory (sociology)","score":0.43779999017715454},{"id":"https://openalex.org/keywords/trajectory","display_name":"Trajectory","score":0.400299996137619},{"id":"https://openalex.org/keywords/optimization-problem","display_name":"Optimization problem","score":0.3702999949455261},{"id":"https://openalex.org/keywords/guidance-system","display_name":"Guidance system","score":0.3677999973297119}],"concepts":[{"id":"https://openalex.org/C97541855","wikidata":"https://www.wikidata.org/wiki/Q830687","display_name":"Reinforcement learning","level":2,"score":0.6477000117301941},{"id":"https://openalex.org/C41008148","wikidata":"https://www.wikidata.org/wiki/Q21198","display_name":"Computer science","level":0,"score":0.5386000275611877},{"id":"https://openalex.org/C155512373","wikidata":"https://www.wikidata.org/wiki/Q287450","display_name":"Residual","level":2,"score":0.5080999732017517},{"id":"https://openalex.org/C2776036281","wikidata":"https://www.wikidata.org/wiki/Q48769818","display_name":"Constraint (computer-aided design)","level":2,"score":0.4717000126838684},{"id":"https://openalex.org/C50644808","wikidata":"https://www.wikidata.org/wiki/Q192776","display_name":"Artificial neural network","level":2,"score":0.45579999685287476},{"id":"https://openalex.org/C47446073","wikidata":"https://www.wikidata.org/wiki/Q5165890","display_name":"Control theory (sociology)","level":3,"score":0.43779999017715454},{"id":"https://openalex.org/C13662910","wikidata":"https://www.wikidata.org/wiki/Q193139","display_name":"Trajectory","level":2,"score":0.400299996137619},{"id":"https://openalex.org/C154945302","wikidata":"https://www.wikidata.org/wiki/Q11660","display_name":"Artificial intelligence","level":1,"score":0.3939000070095062},{"id":"https://openalex.org/C133731056","wikidata":"https://www.wikidata.org/wiki/Q4917288","display_name":"Control engineering","level":1,"score":0.39340001344680786},{"id":"https://openalex.org/C137836250","wikidata":"https://www.wikidata.org/wiki/Q984063","display_name":"Optimization problem","level":2,"score":0.3702999949455261},{"id":"https://openalex.org/C201004817","wikidata":"https://www.wikidata.org/wiki/Q1707071","display_name":"Guidance system","level":2,"score":0.3677999973297119},{"id":"https://openalex.org/C79487989","wikidata":"https://www.wikidata.org/wiki/Q934680","display_name":"Vehicle dynamics","level":2,"score":0.3569999933242798},{"id":"https://openalex.org/C127413603","wikidata":"https://www.wikidata.org/wiki/Q11023","display_name":"Engineering","level":0,"score":0.3483000099658966},{"id":"https://openalex.org/C2779530757","wikidata":"https://www.wikidata.org/wiki/Q1207505","display_name":"Quality (philosophy)","level":2,"score":0.3278999924659729},{"id":"https://openalex.org/C2778464233","wikidata":"https://www.wikidata.org/wiki/Q1649097","display_name":"Proportional navigation","level":3,"score":0.3255999982357025},{"id":"https://openalex.org/C126255220","wikidata":"https://www.wikidata.org/wiki/Q141495","display_name":"Mathematical optimization","level":1,"score":0.32350000739097595},{"id":"https://openalex.org/C141934464","wikidata":"https://www.wikidata.org/wiki/Q3305386","display_name":"Local optimum","level":2,"score":0.30489999055862427},{"id":"https://openalex.org/C522053795","wikidata":"https://www.wikidata.org/wiki/Q2335090","display_name":"Missile guidance","level":3,"score":0.3001999855041504},{"id":"https://openalex.org/C143724316","wikidata":"https://www.wikidata.org/wiki/Q312468","display_name":"Series (stratigraphy)","level":2,"score":0.2784000039100647},{"id":"https://openalex.org/C196340769","wikidata":"https://www.wikidata.org/wiki/Q7698910","display_name":"Temporal difference learning","level":3,"score":0.2782000005245209},{"id":"https://openalex.org/C44154836","wikidata":"https://www.wikidata.org/wiki/Q45045","display_name":"Simulation","level":1,"score":0.2720000147819519},{"id":"https://openalex.org/C206831581","wikidata":"https://www.wikidata.org/wiki/Q9288712","display_name":"Yaw","level":2,"score":0.2653999924659729},{"id":"https://openalex.org/C2775907273","wikidata":"https://www.wikidata.org/wiki/Q7805281","display_name":"Time constraint","level":2,"score":0.25540000200271606},{"id":"https://openalex.org/C125583679","wikidata":"https://www.wikidata.org/wiki/Q755673","display_name":"Search algorithm","level":2,"score":0.25429999828338623}],"mesh":[],"locations_count":1,"locations":[{"id":"doi:10.48550/arxiv.2405.03711","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2405.03711","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":null,"raw_source_name":null,"raw_type":"article-journal"}],"best_oa_location":{"id":"doi:10.48550/arxiv.2405.03711","is_oa":true,"landing_page_url":"https://doi.org/10.48550/arxiv.2405.03711","pdf_url":null,"source":{"id":"https://openalex.org/S4306400194","display_name":"arXiv (Cornell University)","issn_l":null,"issn":null,"is_oa":true,"is_in_doaj":false,"is_core":false,"host_organization":"https://openalex.org/I205783295","host_organization_name":"Cornell University","host_organization_lineage":["https://openalex.org/I205783295"],"host_organization_lineage_names":[],"type":"repository"},"license":null,"license_id":null,"version":null,"is_accepted":false,"is_published":false,"raw_source_name":null,"raw_type":"article-journal"},"sustainable_development_goals":[],"awards":[],"funders":[],"has_content":{"pdf":false,"grobid_xml":false},"content_urls":null,"referenced_works_count":0,"referenced_works":[],"related_works":[],"abstract_inverted_index":{"Guidance":[0],"commands":[1,49,61,127,155],"of":[2,8,73,99,156,208,219,244,249,285],"flight":[3,44,56],"vehicles":[4],"are":[5,169,186],"a":[6,19,134,246,282],"series":[7],"data":[9],"sets":[10],"with":[11],"fixed":[12],"time":[13,106],"intervals,":[14],"thus":[15],"guidance":[16,48,60,75,126,154,234],"design":[17,76,235],"constitutes":[18],"sequential":[20],"decision":[21],"problem":[22,98],"and":[23,53,117,182,263],"satisfies":[24],"the":[25,39,42,54,64,69,71,74,80,85,89,105,109,118,124,140,145,153,157,165,172,175,178,183,191,198,206,211,217,220,225,232,239,254,259,270,276],"basic":[26],"conditions":[27],"for":[28],"using":[29],"deep":[30,264],"reinforcement":[31],"learning":[32,184],"(DRL).":[33],"In":[34,139],"this":[35,132],"paper,":[36],"we":[37,143,194],"consider":[38],"scenario":[40],"where":[41,104],"escape":[43],"vehicle":[45,57],"(EFV)":[46],"generates":[47,59],"based":[50,62,202,237],"on":[51,63,122,238],"DRL":[52],"pursuit":[55],"(PFV)":[58],"proportional":[65],"navigation":[66],"method.":[67],"For":[68,130],"EFV,":[70],"objective":[72],"entails":[77],"progressively":[78],"maximizing":[79],"residual":[81,247,255,283],"velocity,":[82],"subject":[83],"to":[84,151,196,214],"constraint":[86],"imposed":[87],"by":[88,162,222,258,279],"given":[90],"evasion":[91],"distance.":[92],"Thus":[93],"an":[94],"irregular":[95],"dynamic":[96],"max-min":[97],"extremely":[100],"large-scale":[101],"is":[102,115,137,242],"formulated,":[103],"instant":[107],"when":[108],"optimal":[110],"solution":[111,120,221],"can":[112],"be":[113],"attained":[114],"uncertain":[116],"optimum":[119],"depends":[121],"all":[123],"intermediate":[125],"generated":[128],"before.":[129],"solving":[131],"problem,":[133],"two-step":[135],"strategy":[136,200],"conceived.":[138],"first":[141],"step,":[142,193],"use":[144],"proximal":[146],"policy":[147,266],"optimization":[148],"(PPO)":[149],"algorithm":[150,241,274,278],"generate":[152],"EFV.":[158],"The":[159],"results":[160,229],"obtained":[161],"PPO":[163,209,240,273,277],"in":[164,190,224],"global":[166],"search":[167],"space":[168],"coarse,":[170],"despite":[171],"fact":[173],"that":[174,231],"reward":[176],"function,":[177],"neural":[179],"network":[180],"parameters":[181],"rate":[185],"designed":[187],"elaborately.":[188],"Therefore,":[189],"second":[192],"propose":[195],"invoke":[197],"evolution":[199],"(ES)":[201],"algorithm,":[203],"which":[204],"uses":[205],"result":[207],"as":[210],"initial":[212],"value,":[213],"further":[215],"improve":[216],"quality":[218],"searching":[223],"local":[226],"space.":[227],"Simulation":[228],"demonstrate":[230],"proposed":[233,271],"method":[236],"capable":[243],"achieving":[245,281],"velocity":[248,284],"67.24":[250],"m/s,":[251],"higher":[252],"than":[253],"velocities":[256],"achieved":[257],"benchmark":[260],"soft":[261],"actor-critic":[262],"deterministic":[265],"gradient":[267],"algorithms.":[268],"Furthermore,":[269],"ES-enhanced":[272],"outperforms":[275],"2.7\\%,":[280],"69.04":[286],"m/s.":[287]},"counts_by_year":[],"updated_date":"2025-11-06T06:51:31.235846","created_date":"2025-10-10T00:00:00"}