<html><head><meta http-equiv="Content-Type" content="text/html; charset=us-ascii"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div dir="auto" style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div dir="auto" style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><br class=""><div class="" style="orphans: 2; widows: 2;"><span class="" style="font-size: 14px;"></span></div><div class="" style="orphans: 2; widows: 2;"><br class=""></div><div class="" style="orphans: 2; widows: 2;"><div class="" style="margin: 0in 0in 0.0001pt;"><b class=""><font size="4" class="">Haryadi Gunawi</font></b></div><div class="" style="margin: 0in 0in 0.0001pt;"><span class="" style="font-size: 14px;"><i class="">University of Chicago<br class=""></i></span><div class=""><span class="" style="font-size: 14px;"><i class=""><span class="Apple-tab-span" style="white-space: pre;">   </span></i></span></div></div><div class="" style="margin: 0in 0in 0.0001pt;"><b class=""><font class="" style="font-size: 14px;"><br class=""></font></b></div><div class="" style="margin: 0in 0in 0.0001pt;"><span class="" style="font-size: 14px;"><b class=""><font class="">Thursday, October 4, 2018 at 3:30 pm<br class="">Crerar 390</font></b><br class=""></span></div></div><div class="" style="orphans: 2; widows: 2;"><span class="" style="font-size: 14px;"><br class=""></span></div><div class=""><br class=""></div><div class=""><div class=""><b class="" style="color: rgb(33, 33, 33); font-family: Roboto, Helvetica, Arial, sans-serif; font-size: 14px;">Title:  </b><font color="#212121" face="Roboto, Helvetica, Arial, sans-serif" class=""><span style="caret-color: rgb(33, 33, 33); font-size: 14px;" class="">Faults at Scale: What New Bugs Live in the Cloud and How to Exterminate Them</span></font></div><div class="" style="color: rgb(33, 33, 33); font-family: Roboto, Helvetica, Arial, sans-serif; font-size: 14px;"><b class=""><br class=""></b></div><div class="" style="color: rgb(33, 33, 33); font-family: Roboto, Helvetica, Arial, sans-serif; font-size: 14px;"><b class="">Abstract:</b></div><div class=""><font class=""><span class=""><div class="" style="font-variant-ligatures: normal; background-color: rgb(255, 255, 255);"><div class=""><font color="#222222" class=""><span style="caret-color: rgb(34, 34, 34); font-size: 14px;" class="">As more data and computation move from local to cloud environments, datacenter distributed systems have become a dominant backbone for many modern applications. However, the complexity of cloud-scale hardware and software ecosystems has outpaced existing testing, debugging, and verification tools.<br class=""><br class="">I will describe several classes of new bugs that surface in large-scale datacenter distributed systems: (1) distributed concurrency bugs, caused by non-deterministic timings of distributed events such as message arrivals as well as multiple crashes and reboots; (2) tail-performance faults that surface in the presence of "limping" hardware or heavy contention that can cause cascades of performance failures; and (3) scalability faults, latent faults that are scale dependent, typically only surface in large-scale deployments (100+ nodes) but not necessarily in small/medium-scale deployments. These findings are based on our long, large-scale cloud bug and outage studies (3000+ bugs and 500+ outages).<br class=""><br class="">I will present our various approaches in combating these bugs/faults such as highly scalable semantic-aware software model checkers for discovering distributed concurrency bugs and tail-tolerant operating-system supports for circumventing millisecond performance<br class="">faults.<br class=""><br class=""> <br class=""></span></font></div></div></span></font><b class="" style="color: rgb(33, 33, 33); font-family: Roboto, Helvetica, Arial, sans-serif; font-size: 14px;">Bio:</b></div><div class=""><div class="" style="font-variant-ligatures: normal; background-color: rgb(255, 255, 255);"><font color="#222222" class=""><span style="caret-color: rgb(34, 34, 34); font-size: 14px;" class=""><i class="">Haryadi S. Gunawi is a Neubauer Family Assistant Professor in the Department of Computer Science at the University of Chicago where he leads the UCARE research group (UChicago systems research on Availability, Reliability, and Efficiency). He received his Ph.D. in Computer Science from the University of Wisconsin, Madison in 2009. He was a postdoctoral fellow at the University of California, Berkeley from 2010 to 2012. His current research focuses on cloud computing reliability and new storage technology. He has won numerous awards including NSF CAREER award, NSF Computing Innovation Fellowship, Google Faculty Research Award, NetApp Faculty Fellowships, and Honorable Mention for the 2009 ACM Doctoral Dissertation Award.</i></span></font></div><div class=""><font color="#222222" class=""><span class="" style="font-size: 14px;"><i class=""><br class=""></i></span></font></div></div></div><div class=""><br class="Apple-interchange-newline">
</div>
<br class=""></div></div></body></html>