<div dir="ltr"><div dir="ltr"><div class="gmail_default"><div dir="ltr"><div><div class="gmail_default" style="font-size:small;font-weight:bold"><font color="#000000" face="arial, helvetica, sans-serif">When: <span style="font-weight:400">    Wednesday, February 13th </span><span class="m_-1283864891675712771gmail-m_7918266310955697372m_3041760637973938353gmail-m_-82365750322712128gmail-m_-5488285453022690997gmail-m_1516749392281344011gmail-m_-2872424850751301179gmail-m_4851397928119953330gmail-m_-6533301490748126930gmail-m_659755472794929801gmail-m_-6461243813863673855gmail-m_-742000311328020925gmail-m_7559459027998801583gmail-m_4801029585485711767gmail-m_8517121454174849988gmail-m_-6691959996525573090gmail-m_1517372298344856049gmail-m_491069367152086750gmail-m_-8327640324523575189gmail-m_2420618808463760418gmail-m_7960197898027616883gmail-m_8692226636264124041gmail-m_2794822896869921223gmail-m_7508998950622620526gmail-m_-7153355664495542534gmail-il" style="font-weight:400">at</span><span style="font-weight:400"> </span><b>11:00 am</b></font></div><div class="gmail_default" style="font-size:small"><font color="#000000" face="arial, helvetica, sans-serif"><br></font></div><div class="gmail_default" style="font-size:small;font-weight:bold"><font color="#000000" face="arial, helvetica, sans-serif">Where:<span style="font-weight:400">    </span><span class="m_-1283864891675712771gmail-m_7918266310955697372m_3041760637973938353gmail-m_-82365750322712128gmail-m_-5488285453022690997gmail-m_1516749392281344011gmail-m_-2872424850751301179gmail-m_4851397928119953330gmail-m_-6533301490748126930gmail-m_659755472794929801gmail-m_-6461243813863673855gmail-m_-742000311328020925gmail-m_7559459027998801583gmail-m_4801029585485711767gmail-m_8517121454174849988gmail-m_-6691959996525573090gmail-m_1517372298344856049gmail-m_491069367152086750gmail-m_-8327640324523575189gmail-m_2420618808463760418gmail-m_7960197898027616883gmail-m_8692226636264124041gmail-m_2794822896869921223gmail-m_7508998950622620526gmail-m_-7153355664495542534gmail-m_8421504075585210435gmail-m_3262824545120381495gmail-m_-1141671822915777344gmail-m_-7219251726624328345gmail-m_-8588148075564318222gmail-m_-8767966813928691312gmail-m_-1542318334608687154gmail-m_5717104778280916634gmail-m_4845490158781220632gmail-m_5124567205141626540gmail-m_3209361100497750746gmail-m_2953668934074478317gmail-m_-3155518689668024534m_9067904842688472155gmail-m_3071693547520408192gmail-il" style="font-weight:400"><span class="m_-1283864891675712771gmail-m_7918266310955697372m_3041760637973938353gmail-m_-82365750322712128gmail-m_-5488285453022690997gmail-m_1516749392281344011gmail-m_-2872424850751301179gmail-m_4851397928119953330gmail-m_-6533301490748126930gmail-m_659755472794929801gmail-m_-6461243813863673855gmail-m_-742000311328020925gmail-m_7559459027998801583gmail-m_4801029585485711767gmail-m_8517121454174849988gmail-m_-6691959996525573090gmail-m_1517372298344856049gmail-m_491069367152086750gmail-m_-8327640324523575189gmail-m_2420618808463760418gmail-m_7960197898027616883gmail-m_8692226636264124041gmail-m_2794822896869921223gmail-m_7508998950622620526gmail-m_-7153355664495542534gmail-il"><span class="m_-1283864891675712771gmail-m_7918266310955697372m_3041760637973938353gmail-m_-82365750322712128gmail-m_-5488285453022690997gmail-m_1516749392281344011gmail-m_-2872424850751301179gmail-m_4851397928119953330gmail-m_-6533301490748126930gmail-m_659755472794929801gmail-m_-6461243813863673855gmail-m_-742000311328020925gmail-m_7559459027998801583gmail-m_4801029585485711767gmail-il">TTIC</span></span></span><span style="font-weight:400">, 6045 S Kenwood Avenue, 5th Floor, Room 526</span></font></div><div class="gmail_default" style="font-size:small"><font face="arial, helvetica, sans-serif"><br></font></div><font face="arial, helvetica, sans-serif" style="font-size:small"><span style="font-weight:bold;color:rgb(0,0,0)">Who:</span><span style="color:rgb(0,0,0)">      </span></font><font color="#000000" face="arial, helvetica, sans-serif">Josiah Hanna, UT Austin</font></div></div><div dir="ltr" style="font-size:small"><br></div><div dir="ltr" style="font-size:small"><br></div><div dir="ltr" style="font-size:small"><b>Title:</b>       Data Efficient Reinforcement learning for Autonomous Robots with Simulated and Off-policy Data<br><b><br>Abstract:</b><br>Learning from interaction with the environment -- trying untested actions, observing successes and failures, and tying effects back to causes -- is one of the first capabilities thought of when considering intelligent agents. Reinforcement learning is the area of artificial intelligence research that has the goal of allowing autonomous agents to learn in this way. Despite many recent empirical successes, most modern reinforcement learning algorithms are still limited by the large amounts of experience required before useful skills are learned. Making reinforcement learning more data efficient would allow computers to autonomously solve complex tasks in dynamic environments such as those found in robotics, traffic management, or healthcare.<br><br>My research focuses on giving agents the ability to predict how their actions influence their ability to solve a given task. In this talk, I will describe my research in this area and how efficient prediction connects to efficient reinforcement learning. In the first part of the talk, I will introduce an algorithm that allows an agent to find informative exploratory behaviors for learning how it’s actions influence task performance. In the second part of the talk, I will introduce an algorithm that allows robot skills learned in simulated environments to transfer to the real world. Finally, I will describe directions for future work that will lead to an increased applicability of reinforcement learning to real world problems.<br><br><div><b>Bio:</b><br>Josiah Hanna is a PhD candidate in the computer science department at the University of Texas at Austin advised by Professor Peter Stone. Prior to attending UT Austin, he completed his bachelors degree in computer science and mathematics at the University of Kentucky advised by Professor Judy Goldsmith. During the summer of 2017, he completed a research internship at Google. Josiah is an NSF Graduate Research Fellow and an IBM PhD Fellow.</div><div><br></div><div><br></div><div><b>Host: </b><a href="mailto:mwalter@ttic.edu" target="_blank">Matthew Walter</a></div></div><div class="m_-1283864891675712771gmail-m_8293318239901793351gmail-yj6qo m_-1283864891675712771gmail-m_8293318239901793351gmail-ajU" style="font-size:small;outline:none;padding:10px 0px;width:22px;margin:2px 0px 0px"><br></div><div class="m_-1283864891675712771gmail-m_8293318239901793351gmail-yj6qo m_-1283864891675712771gmail-m_8293318239901793351gmail-ajU" style="font-size:small;outline:none;padding:10px 0px;width:22px;margin:2px 0px 0px"><br></div><div class="m_-1283864891675712771gmail-m_8293318239901793351gmail-yj6qo m_-1283864891675712771gmail-m_8293318239901793351gmail-ajU" style="font-size:small;outline:none;padding:10px 0px;width:22px;margin:2px 0px 0px"><br></div></div><div><div dir="ltr" class="m_-1283864891675712771gmail-m_8293318239901793351gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><font face="arial, helvetica, sans-serif">Mary C. Marre</font><div><font face="arial, helvetica, sans-serif">Administrative Assistant</font></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6"><b>Toyota Technological Institute</b></font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">6045 S. Kenwood Avenue</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Room 517</font></i></div><div><i><font face="arial, helvetica, sans-serif" color="#3d85c6">Chicago, IL  60637</font></i></div><div><i><font face="arial, helvetica, sans-serif">p:(773) 834-1757</font></i></div><div><i><font face="arial, helvetica, sans-serif">f: (773) 357-6970</font></i></div><div><b><i><a href="mailto:mmarre@ttic.edu" target="_blank"><font face="arial, helvetica, sans-serif">mmarre@ttic.edu</font></a></i></b></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div>